tcp
长链接模式下,使用固定消息头长度的方式进行消息 拆包
,解决 粘包
问题。
固定消息头协议
将消息头的前N个字节固定为 消息长度位
,结合业务场景, 2bytes
或 4bytes
,读取消息时先读取 消息长度位
,即可按具体的 消息长度
读取 消息内容
。
pack/unpack
可以 打包数值至二进制
/ 解包二进制至数值
,具体的模式可以参考pack/unpack 详细用法,这里我们选用固定头长度为 2bytes
来表示 消息体长度
,最大能表示 2^16 - 1
长度的消息体,不够你就上 4bytes
好了。
组包
代码语言:javascript复制<?php
// msg protocol
// | ---- dataLen ---- | data |
// | - fixed 2bytes - |
// 模拟客户端连续发送2条消息
$foo = "hello world";
$bar = "i am sqrt_cat";
$package = "";
// 使用 n 打包 固定2bytes
$fooLenn = pack("n", strlen($foo));
$package = $fooLenn . $foo;
$barLenn = pack("n", strlen($bar));
$package .= $barLenn . $bar;
粘包
代码语言:javascript复制// send
// 传输 $package 由 $foo $bar 两条消息组成 模拟粘包场景
// receive
拆包
代码语言:javascript复制<?php
// 解析第1条消息 取前 2bytes 按 n 解包
$fooLen = unpack("n", substr($package, 0, 2))[1];
// 使用包消息体长度定义读取消息体
// 从第 3byte 开始读 前 2bytes表示长度
$foo = substr($package, 2, $fooLen);
echo $foo . PHP_EOL;
// 解析第2条消息 取前 2bytes 按 n 解包
// 0 ~ (2 fooLen) - 1 字节序为 fooLen . foo
// (2 fooLen) ~ (2 fooLen) 2 - 1 为 barLen
$barLen = unpack("n", substr($package, (2 $fooLen), 2))[1];
$bar = substr($package, (2 $fooLen) 2, $barLen);
echo $bar . PHP_EOL;
日常工作中经常遇到的 tcp
场景可能是 短连接单个消息
的模式,客户端发送一条消息后便关闭连接,服务端循环读取到 EOF
即可得到一条完整的消息。但如果是 短连接多个消息
或 长链接模式
下,就可能会发生粘包,客户端不关闭服务端无法通过 EOL
确定消息读取完毕的问题。这就需要定义协议和拆包。