根本原因是json_encode()只处理utf-8字符串,若输入非utf-8(如gbk),会返回false或空字段;必须确保数据源(数据库、文件、post等)统一转为utf-8后再encode。

PHP 输出 JSON 中文乱码,根本原因不是没加编码,而是 json_encode() 默认只处理 UTF-8 字符串 —— 如果输入数据本身不是 UTF-8(比如 GBK/GB2312 来源的字符串),直接 encode 就会出 或空字段。
确认原始数据编码是否为 UTF-8
很多乱码问题其实卡在源头:数据库、文件、POST 数据、第三方接口返回值本身不是 UTF-8。不能只盯着 header() 或 mb_internal_encoding()。
- 用
mb_detect_encoding($str, ['UTF-8', 'GBK', 'GB2312'], true)检查字符串真实编码(注意第三个参数true表示 strict 检测) - MySQL 连接必须设为 UTF-8:
mysqli_set_charset($conn, 'utf8mb4')或 PDO DSN 加;charset=utf8mb4 - 读取本地文件时,用
file_get_contents()后先mb_convert_encoding($content, 'UTF-8', 'GBK')转码(按实际源编码填)
json_encode() 前必须确保所有字符串是 UTF-8
json_encode() 对非 UTF-8 字符串行为未定义 —— 5.4+ 返回 false,旧版可能静默替换为空或问号。它不负责转码,只负责编码。
- 数组整体转码不可靠,要逐字段检查:
is_string($val) && !mb_check_encoding($val, 'UTF-8') - 推荐封装一个安全 encode 函数:
function safe_json_encode($data) { array_walk_recursive($data, function (&$item) { if (is_string($item) && !mb_check_encoding($item, 'UTF-8')) { $item = mb_convert_encoding($item, 'UTF-8', 'GBK'); // 按实际源编码调整 } }); return json_encode($data, JSON_UNESCAPED_UNICODE | JSON_INVALID_UTF8_SUBSTITUTE); } -
JSON_INVALID_UTF8_SUBSTITUTE(PHP 7.2+)可让非法 UTF-8 字节被替换成 ,避免整个 encode 失败
HTTP 响应头和浏览器解析无关 JSON 编码
设置 header('Content-Type: application/json; charset=utf-8') 是良好实践,但它**不影响 json_encode() 的输出内容**,只告诉浏览器“接下来的字节流按 UTF-8 解释”。如果 JSON 体本身含非法 UTF-8,加 header 也没用。
立即学习“PHP免费学习笔记(深入)”;
- Chrome/Firefox 解析 JSON 时完全忽略响应头中的 charset,只认 JSON 文本是否合法 UTF-8
-
mb_internal_encoding('UTF-8')仅影响mb_*系列函数,默认编码,对json_encode()无作用 - 不要用
iconv('GBK', 'UTF-8//IGNORE', $str),//IGNORE可能截断多字节字符,mb_convert_encoding()更稳妥
真正关键的就两点:数据进来时转成干净 UTF-8,再进 json_encode();别指望 header 或内部编码设置能“自动修复”乱码。很多线上问题反复出现,是因为只改了输出 header,却没查数据库连接或 POST 数据的实际编码。











