PHP文件未声明UTF-8导致浏览器误判编码而乱码,解决方法是在文件最顶部添加header('Content-Type: text/html; charset=utf-8');或在HTML中加meta标签。

PHP文件本身没声明UTF-8,浏览器就猜错编码
很多乱码不是数据库导致的,是PHP脚本输出时没告诉浏览器“我是UTF-8”。浏览器按ISO-8859-1或GBK去解,中文自然变问号或方块。
解决方法很简单:在PHP文件最顶部(之前不能有任何输出,包括空格和BOM)加这行:
header('Content-Type: text/html; charset=utf-8');
如果用的是HTML模板,也要确保HTML里有对应meta标签:
- 不要用
header()前有echo、空行、BOM——会报“headers already sent”错误 - VS Code、Notepad++保存PHP文件时选“UTF-8 无BOM”,别选“UTF-8 with BOM”
- 用
mb_http_output('UTF-8')可额外锁定输出编码,但header()已够用
MySQL连接时没设字符集,查询结果默认走latin1
PHP用mysqli或PDO连MySQL,默认不强制用UTF-8。即使数据库/表是utf8mb4,连接层仍可能用latin1通信,导致中文存进去是乱码,查出来也是乱码。
立即学习“PHP免费学习笔记(深入)”;
两种主流方式必须选一个,不能只改一边:
-
mysqli_set_charset($conn, 'utf8mb4')—— 推荐,简单直接,适用于mysqli面向对象或过程式写法 - PDO连接DSN里加
;charset=utf8mb4,例如:mysql:host=localhost;dbname=test;charset=utf8mb4 - 别用
SET NAMES utf8模拟——它只是发SQL指令,不如原生接口可靠,且不保证预处理语句生效
验证是否生效:连上后执行SELECT @@character_set_client, @@character_set_connection, @@character_set_results,三个值都应为utf8mb4。
数据库表和字段不是utf8mb4,存不进emoji或生僻字
只设连接编码还不够。如果建表时用的是utf8(MySQL里的阉割版,最多3字节),那emoji、某些中文古字、数学符号都会被截断或替换成?。
必须确认并修正存储层:
- 查表字符集:
SHOW CREATE TABLE `users`,看DEFAULT CHARSET=和各字段CHARACTER SET - 改表到完整UTF-8:
ALTER TABLE `users` CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci - 单独改字段(如已有字段是utf8):
ALTER TABLE `users` MODIFY `name` VARCHAR(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci - MySQL配置文件(my.cnf)里加上
collation-server = utf8mb4_unicode_ci和init-connect='SET NAMES utf8mb4'(仅对非root用户生效)
PHP输出JSON时中文变\uXXXX,不是乱码而是转义
用json_encode()返回JSON给前端,中文显示成\u676e这类Unicode转义,这不是乱码,是PHP默认行为。浏览器能正常还原,但看着像乱码。
想让JSON里直接显示中文,加JSON_UNESCAPED_UNICODE标志:
echo json_encode($data, JSON_UNESCAPED_UNICODE);
- PHP 5.4+才支持这个常量,老版本只能自己写函数替换\u
- 别漏掉
header('Content-Type: application/json; charset=utf-8'),否则部分安卓WebView可能解析失败 - 如果用了
json_encode()后还是乱码,先检查$data来源——比如从数据库读出时连接没设utf8mb4,那转出来的就是错的原始字节
mysqli_set_charset()根本没调。两头都要验,不能只信“我设过了”。











