php中文乱码根本原因是文件编码、http响应头、浏览器解码三者不一致;需确保脚本为utf-8无bom,header在输出前调用,数据库用utf8mb4,文件读写手动转码,json用json_unescaped_unicode。

PHP 输出中文变问号或方块,header 设置没用?
根本原因不是 header 没设,而是 PHP 脚本文件本身编码、HTTP 响应头、浏览器解码三者不一致。最常踩的坑是:脚本存成了 GBK,却用 header('Content-Type: text/html; charset=utf-8') 强行声明 UTF-8 —— 浏览器按 UTF-8 解,但文件里实际是 GBK 字节,必然乱码。
- 检查 PHP 文件保存编码:必须是 UTF-8 无 BOM(用 VS Code、Notepad++ 等编辑器确认,别信 IDE 默认)
-
header必须在任何输出前调用(包括空格、<?php前的换行) - 如果用了
echo或print之前有空白,header会报Warning: Cannot modify header information - HTML 中也建议加
<meta charset="utf-8">,作为 header 的后备(尤其调试时)
读取数据库中文乱码,mysql_set_charset 已废弃怎么办?
PHP 7+ 废弃了 mysql_* 函数,改用 mysqli 或 PDO 后,光连上数据库还不够,连接层、表字段、客户端三者字符集要对齐。常见现象:phpMyAdmin 看数据正常,PHP echo 出来是乱码。
- 使用
mysqli时,连接后立刻执行$mysqli->set_charset('utf8mb4')(注意是utf8mb4,不是utf8) - 使用
PDO时,在 DSN 中加上;charset=utf8mb4,例如:mysql:host=localhost;dbname=test;charset=utf8mb4 - 确认 MySQL 表和字段字符集是
utf8mb4_unicode_ci(utf8在 MySQL 里实际只支持 3 字节 UTF-8,emoji 和部分生僻字会截断) - 避免用
SET NAMES utf8,它不等价于set_charset,可能被连接池或中间件干扰
文件读写中文名/内容乱码,file_get_contents 返回空或乱码?
PHP 原生函数默认按字节操作,不识别编码。读写含中文的路径或内容时,乱码往往来自路径解析失败或编码转换缺失,而不是函数本身问题。
- Windows 下读写中文路径,确保 PHP 运行环境(如 Apache/Nginx + PHP-FPM)的 locale 支持中文,否则
file_exists('测试.txt')可能返回 false -
file_get_contents和file_put_contents不处理编码转换,若文件是 GBK 编码,直接读进 UTF-8 脚本就会乱;需手动转:iconv('GBK', 'UTF-8//IGNORE', $content) - 写入文件前,用
mb_convert_encoding($str, 'UTF-8', 'auto')自动探测源编码(慎用,auto不可靠,优先明确来源) - 避免用
fopen+fgets逐行读 GBK 文件——换行符可能被误判,改用file()+iconv更稳
JSON 中文被转成 \uXXXX,json_encode 怎么保留原文?
json_encode 默认把非 ASCII 字符转义为 Unicode,这是标准行为,不是 bug。但前端渲染或日志查看时,显示 \u6d4b\u8bd5 很不直观,尤其调试接口时。
立即学习“PHP免费学习笔记(深入)”;
- PHP 5.4+ 加
JSON_UNESCAPED_UNICODE标志即可:json_encode($data, JSON_UNESCAPED_UNICODE) - 注意:如果
$data里混着 GBK 编码的字符串,先转 UTF-8 再 encode,否则会出错或乱码 - Apache + mod_php 环境下,若输出 JSON 后中文仍乱码,检查是否被输出缓冲或 gzip 中间件二次编码(比如某些 CDN 会强制转码)
- 不要为了“好看”而关掉
JSON_UNESCAPED_UNICODE—— 它不影响解析,前端JSON.parse能正确还原
字符编码问题从来不是单点故障,而是链条断裂:编辑器存什么、PHP 怎么读、MySQL 怎么存、HTTP 怎么传、浏览器怎么解——漏掉任意一环,中文就变问号。最容易被忽略的是 MySQL 的 utf8mb4 和文件本身的 BOM 头。











