php json_encode() 报错“invalid utf-8序列”需检查并修复非法utf-8字符串,可用mb_check_encoding提前校验、mb_convert_encoding转码,并在连接数据库时统一设置charset为utf8mb4。

PHP json_encode() 报错 “Invalid UTF-8 sequence” 怎么办
直接原因是传给 json_encode() 的字符串里混了非法 UTF-8 字节,比如 GBK 编码的中文、二进制垃圾数据、或截断的多字节字符。PHP 不会自动转码,只校验——校验不过就返回 false,且默认不报错(容易被忽略)。
- 加
JSON_THROW_ON_ERROR标志强制抛异常,第一时间暴露问题:json_encode($data, JSON_THROW_ON_ERROR)
- 用
mb_check_encoding($str, 'UTF-8')提前筛一遍字符串,非 UTF-8 的先转:mb_convert_encoding($str, 'UTF-8', 'GBK')
- 数据库字段如果设的是
latin1或没声明utf8mb4,读出来就是乱码字节,必须在 PDO/MySQLi 连接时统一设 charset,不能只靠 PHP 端补救
PHP json_encode() 把中文转成 \uXXXX 怎么关掉
这是默认行为,不是 bug。PHP 5.4+ 开始,json_encode() 对非 ASCII 字符做 Unicode 转义,为的是兼容性(尤其老 IE)。但接口文档、日志、调试时看着难受。
- 加
JSON_UNESCAPED_UNICODE标志即可:json_encode($data, JSON_UNESCAPED_UNICODE)
- 注意:该标志在 PHP 5.4+ 才有,低于此版本只能自己
preg_replace()替换 \uXXXX,但风险高(可能误伤正常 JSON 内容) - 如果用了
JSON_UNESCAPED_UNICODE后响应头仍是Content-Type: application/json,浏览器/客户端一般都能正确解码,无需额外加charset=utf-8(HTTP 规范中 JSON 默认就是 UTF-8)
PHP json_encode() 处理对象时丢失私有属性怎么办
PHP 默认只序列化 public 属性。private/protected 属性不会进 JSON,也不会触发 __get(),除非类实现了 JsonSerializable 接口。
- 最稳妥的方式是让类实现
JsonSerializable接口,重写jsonSerialize()方法,明确返回要导出的字段数组 - 不要依赖
__toString()或魔术方法“绕过”,json_encode()完全不调用它们 - 如果只是临时调试,可用
(array) $obj强转再 encode,但会暴露出私有属性名带的不可见字符(如"\0*\0prop"),JSON 解析端很可能失败
PHP json_encode() 返回空字符串或 null 的常见原因
不是所有 false 都是编码失败——它也可能是因为输入本身是 null、NaN、或资源类型(如 mysqli_result),这些 PHP 类型 JSON 标准根本不支持。
立即学习“PHP免费学习笔记(深入)”;
- 检查输入值:
var_dump($data)看是不是null、resource、NaN(is_nan()判断)、或含循环引用的对象(会静默失败) - 对资源类型,必须先 fetch 成数组;对循环引用,得手动扁平化或用第三方库(如
symfony/serializer) - 用
json_last_error()+json_last_error_msg()查具体错误,比看返回值更可靠
最麻烦的其实是混合编码场景:MySQL 字段是 utf8mb4,连接层却用 SET NAMES latin1,PHP 读出来就是损坏的 UTF-8,此时任何 json_encode() 参数都救不了——得从数据源头掐断。











