在网络编程中TCP协议相关的肯定会遇到粘包问题,具体原因可查看相关资料,这里仅作简单叙述。着重在workerman中对TCP中消息封包和解包问题的实际处理。

粘包与拆包的概念

在TCP/IP协议中,由于传输层并不了解应用层数据的含义,发送端传输层可能会对应用层数据进行拆分或者合并,在接收端也同样如此。由此而产生的问题就是常常会听说的“粘包与拆包”的问题。“粘包拆包”的问题在“短报文”和“一问一答”的场景下其实并不会出现。短报文是指报文长度远小于MSS的情况,应用层的报文在TCP报文中完全可以放下。另一方面,“一问一答”的通信模式可以保证报文会以单一的TCP包发送出去。在这两个条件下都满足时,我们不需要考虑“粘包拆包”问题。

反之,如果这两个条件不同时满足,就很可能会出现“粘包拆包”问题。

粘包拆包的问题的原因大概有以下几个方面:

  • 应用程序要写入的报文字节数大于套接字缓存区大小,这时候会发生拆包问题。
  • 应用程序的报文字节数小于套接字缓冲区大小,但应用程序连续写入多个数据包,这会导致粘包问题。
  • TCP缓冲区的数据比较多,传输层根据MSS对缓冲区的数据进行分片发送。
粘包与拆包的解决

对于粘包和拆包问题,一般有以下几种解决方法:

  • 使用固定长度的消息,报文长度不够的时候用无效数据填充。
  • 使用换行字符来分割不同的报文。
  • 把消息分为消息头和消息体两个部分,在消息头中添加消息长度的字段。
  • 其他综合多种方法的消息协议。
业务实现
解包

由于在我们的业务主要使用tcp长连接来转发消息体,并且长度不固定,因此选择了在消息体中增加长度(4字节)的方式来解决。

//保存每个连接的待处理消息,须在三次握手建立连接后做初始化
$_MACHINE_CONN = []


$tcp_worker->onMessage = function($connection, $data){
        global $_MACHINE_CONN;

        $conn_id = $connection->id;

        //处理粘包问题
        while (true){
            $curr_data = ((string)$_MACHINE_CONN[$conn_id]['msg_peer']) . $data;

            //不够4字节,无法获得此分段消息长度,继续接收数据
            if(strlen($curr_data)<4){
                $_MACHINE_CONN[$conn_id]['msg_peer'] = $curr_data;
                break;
            }

            //消息长度不够,继续等待接受数据
            $curr_msg_length = intval(substr($curr_data, 0, 4));
            if($curr_msg_length > (strlen($curr_data)-4)){
                $_MACHINE_CONN[$conn_id]['msg_peer'] = $curr_data;
                break;
            }

            //按长度截取有效数据段
            $peer_data = (string)substr($curr_data, 4, $curr_msg_length);
            $data = (string)substr($curr_data, 4+$curr_msg_length);

            $_MACHINE_CONN[$conn_id]['msg_peer'] = '';

            //后续业务处理
        }
}
封包

对每一段完整的消息增加4字节长度的标识,不满四位高位补'0'

$httpMSG = '{"code":"1","reason":"success"}';

//0031{"code":"1","reason":"success"}
$tcp_msg_length = str_pad(strlen($httpMSG),4,"0",STR_PAD_LEFT);

$tcp_conn->send($tcp_msg_length.$httpMSG);

这种方式对业务有一定的限制,并非适合所有业务,使用中请留意。

参考TCP粘包与拆包——基于Netty

Tags: workerman, tcp粘包

Related Posts:

Leave a Comment