PHP WebSocket客户端数据粘包是因未按RFC 6455解析帧结构,TCP本身无消息边界;须手动解析帧头、长度、掩码位,提取并解掩码payload才能正确拆帧。

PHP WebSocket客户端收到的数据为什么粘在一起?
PHP 原生不支持 WebSocket 协议解析,用 fsockopen 或 stream_socket_client 手动实现时,底层 TCP 不保证消息边界 —— 你发 2 次 send(),对方可能一次 recv() 就读到全部,也可能分多次读到。这不是 PHP 的 bug,是 TCP 本身的特性。
真正的问题在于:你没按 WebSocket 帧格式(RFC 6455)解析二进制帧,而是直接把原始字节流当字符串拼接处理。
- WebSocket 数据不是裸 TCP 流,每条有效消息都包裹在「帧(frame)」里,含长度、掩码、操作码等字段
- 服务端若连续发两个文本帧,PHP 客户端若未逐帧剥离,就会把两帧 payload 粘成一串
-
strlen($data)或mb_strlen($data)对粘包数据毫无意义,因为开头的帧头还没被跳过
怎么从原始 socket 数据里正确拆出单个 WebSocket 帧?
必须手动解析 WebSocket 帧结构。关键步骤:先读至少 2 字节获取基础头,再根据 payload length 字段判断是否含扩展长度、是否启用掩码,最后提取 payload 并解掩码(客户端收到的数据一定被服务端掩码过)。
最小可行拆包逻辑(仅处理常见文本帧,无分片):
立即学习“PHP免费学习笔记(深入)”;
// 假设 $buffer 是从 stream_socket_recvfrom 累积的原始字节
while (strlen($buffer) >= 2) {
$first_byte = ord($buffer[0]);
$second_byte = ord($buffer[1]);
$fin = ($first_byte & 0x80) === 0x80;
$opcode = $first_byte & 0x0F;
$masked = ($second_byte & 0x80) === 0x80;
if (!$masked) return false; // 客户端必须拒绝未掩码帧
$payload_len = $second_byte & 0x7F;
$offset = 2;
if ($payload_len === 126) {
if (strlen($buffer) < $offset + 2) break;
$payload_len = unpack('n', substr($buffer, $offset, 2))[1];
$offset += 2;
} elseif ($payload_len === 127) {
if (strlen($buffer) < $offset + 8) break;
$payload_len = unpack('J', substr($buffer, $offset, 8))[1];
$offset += 8;
}
if (strlen($buffer) < $offset + 4) break; // 至少还要 4 字节掩码键
$mask_key = substr($buffer, $offset, 4);
$offset += 4;
if (strlen($buffer) < $offset + $payload_len) break; // 数据还不全
$payload = substr($buffer, $offset, $payload_len);
// 解掩码
$unmasked = '';
for ($i = 0; $i < $payload_len; $i++) {
$unmasked .= $payload[$i] ^ $mask_key[$i % 4];
}
// 成功提取一帧,$unmasked 就是真实文本内容
echo "Received: " . $unmasked . "\n";
// 截掉已处理部分
$buffer = substr($buffer, $offset + $payload_len);
}
用现成库能绕过粘包问题吗?
可以,但得选对库。很多号称“PHP WebSocket client”的包只是简单封装 socket,照样不拆帧 —— 比如直接用 fgets() 读行、或固定长度 stream_socket_recvfrom($socket, 1024),必然粘包。
真正靠谱的库会内置帧解析器:
-
ratchet/pawl:基于 ReactPHP,自动处理帧收发与拆包,onMessage回调拿到的就是完整、解码后的 payload -
textalk/websocket:轻量,WebSocket\Client::receive()返回已解帧内容,内部做了缓冲与帧边界识别 - 避免使用
php-websocket(旧版)、guzzlehttp/guzzle(HTTP 库,不支持 WebSocket 协议)
注意:即使用了这些库,如果服务端发送了分片帧(fragmented frame),仍需手动处理续帧逻辑 —— 大多数业务场景不开启分片,可忽略。
为什么用 stream_set_timeout 或 stream_select 不能解决粘包?
它们只控制「等待数据的时间」和「是否有数据可读」,完全不干预数据如何解释。TCP 层传来的仍是字节流,超时设置再精细,fread($socket, 8192) 还是可能读到半帧、一帧半、或三帧合并。
真正要做的只有两件事:
- 维护一个接收缓冲区(
$buffer),持续追加stream_socket_recvfrom或fread的结果 - 在缓冲区里循环尝试解析帧,成功则消费,失败则继续等下一批数据
- 永远不要假设一次 read 就对应一条业务消息
帧解析本身没有标准函数,PHP 也没有 websocket_decode_frame() 这种内置 API —— 这就是你必须亲手处理粘包的根本原因。











