mysqli_query读取BLOB会因文本协议在\0处截断;必须用mysqli_stmt(二进制协议)或PDO关闭ATTR_STRINGIFY_FETCHES和EMULATE_PREPARES,并用fetchColumn()安全获取原始字节。

PHP用mysqli_query读取BLOB字段会自动截断?
直接用 mysqli_query 执行 SELECT 拿到 BLOB 字段,返回的不是原始二进制数据,而是被 MySQL 客户端库悄悄转成字符串、并可能在遇到 \0 字节时提前截断——这是最常踩的坑。根本原因在于:MySQL 的文本协议默认把 BLOB 当作“带终止符的字符串”处理,而非纯字节流。
解决方法只有两个可靠路径:
- 改用
mysqli_stmt(预处理语句),它走的是二进制协议,能原样返回 BLOB 字节 - 或在查询前执行
SET SESSION sql_mode=''并确保连接字符集设为binary(不推荐,兼容性差)
mysqli_stmt::bind_param + bind_result 正确读取 BLOB 的写法
必须用 bind_result 绑定变量接收,不能用 fetch_assoc() 或 fetch_array() —— 这些函数内部仍走文本解析,BLOB 会被损坏。
$stmt = $mysqli->prepare("SELECT id, file_data FROM documents WHERE id = ?");
$stmt->bind_param("i", $id);
$stmt->execute();
$stmt->bind_result($id, $blob_data); // 注意:这里 $blob_data 是 string 类型,但内容是原始字节
$stmt->fetch();
// $blob_data 现在才是完整二进制内容,可直接 file_put_contents() 或 header() 输出
关键点:
立即学习“PHP免费学习笔记(深入)”;
-
bind_result的变量必须是普通变量(非数组键、非对象属性),否则引用绑定失败 - 如果 BLOB 超过
max_allowed_packet,fetch()会静默失败,需检查$stmt->errno - 不要对
$blob_data做任何utf8_encode、mb_convert_encoding操作——它不是文本
PDO 方式读取 BLOB 必须关闭 PDO::ATTR_STRINGIFY_FETCHES
PDO 默认开启 PDO::ATTR_STRINGIFY_FETCHES,会强制把所有字段(包括 BLOB)转成字符串并尝试编码转换,导致二进制错乱。必须显式关闭:
$pdo = new PDO($dsn, $user, $pass, [
PDO::ATTR_STRINGIFY_FETCHES => false,
PDO::ATTR_EMULATE_PREPARES => false // 关键:禁用模拟预处理,走真实二进制协议
]);
$stmt = $pdo->prepare("SELECT file_data FROM documents WHERE id = ?");
$stmt->execute([$id]);
$blob_data = $stmt->fetchColumn(); // fetchColumn() 可安全返回原始字节
注意:
-
PDO::ATTR_EMULATE_PREPARES => false是硬性要求,模拟预处理下 BLOB 依然走文本协议 - 用
fetch()+fetch()['file_data']仍然危险,因为数组值可能被 stringify 影响;fetchColumn()最稳妥 - 若字段名含大小写或特殊字符,
fetchColumn()需配合getColumnMeta()确认索引
输出 BLOB 到浏览器前必须设置正确的 Content-Type 和禁止输出缓冲
即使数据读对了,输出时漏掉头信息或被输出缓冲截断,前端拿到的仍是损坏文件。
务必检查:
- 用
header('Content-Type: application/octet-stream')或更精确类型(如image/png),不能依赖mime_content_type()临时判断——BLOB 可能没完整读入内存 - 调用
ob_end_clean()清掉之前所有输出缓冲,否则 HTML/空格混入二进制流就废了 - 用
echo $blob_data,别用print_r、var_dump或任何调试输出 - 确认 PHP 没开启
zlib.output_compression,它会对二进制流做不可逆压缩
BLOB 字段本质就是一串字节,PHP 层没有“二进制类型”,只有你是否让它原样穿过各层协议和缓冲。每一步都得盯着协议路径,而不是只看函数名。











