0

0

MySQL数据库基本概念入门:UTF8与UTF8MB4区别及多语言支持设置

P粉602998670

P粉602998670

发布时间:2026-03-03 02:57:27

|

511人浏览过

|

来源于php中文网

原创

mysql的utf8实为utf8mb3,不支持4字节emoji等字符,需改用utf8mb4字符集并配对客户端、html及http编码。

mysql数据库基本概念入门:utf8与utf8mb4区别及多语言支持设置

为什么插入emoji会报 Incorrect string value

这是 MySQL utf8 字符集最典型的“翻车现场”——它根本不是真正的 UTF-8,只支持最多 3 字节的 Unicode 字符(U+0000–U+FFFF),而 emoji(如 ??)、部分生僻汉字(如 ?)、数学符号(如 ?)都是 4 字节字符,落在 U+10000–U+10FFFF 范围内,utf8 直接拒绝存储。

  • 错误示例:INSERT INTO users(name) VALUES('小明?'); → 报错 Incorrect string value: '\xF0\x9F\x98\x8A'...
  • 根本原因:MySQL 的 utf8 实际是 utf8mb3,是历史命名错误,官方已明确承认
  • 解决方案不是调客户端编码,而是把底层字符集换成 utf8mb4——它是唯一能存下这些字符的 MySQL 原生字符集

建表和改表时必须显式指定 utf8mb4,不能依赖服务器默认值

即使你用 SHOW VARIABLES LIKE 'character_set_server'; 看到返回 utf8mb4,也不代表已有表或字段就自动生效。MySQL 的字符集继承是“逐层覆盖”的:服务端 → 数据库 → 表 → 列,任意一层没设对,就会回退到旧配置。

  • 新建表务必写全:CREATE TABLE comments (id INT, content TEXT) CHARSET=utf8mb4 COLLATE=utf8mb4_0900_ai_ci;
  • 修改已有表:ALTER TABLE users CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci;(推荐)或更精细地改列:ALTER TABLE users MODIFY name VARCHAR(50) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci;
  • 注意:如果字段有索引,且原 VARCHAR(255)utf8 下刚好卡在 767 字节限制边缘,改成 utf8mb4 后可能超限(4×255=1020 > 767),需同步缩短长度或开启 innodb_large_prefix

utf8mb4_0900_ai_ci 是 MySQL 8.0+ 默认排序规则,比 utf8mb4_unicode_ci 更准

字符集决定“能存什么”,排序规则(collation)决定“怎么比大小、是否区分大小写、是否忽略重音”。老项目常用 utf8mb4_unicode_ci,但它基于较旧的 Unicode 标准,在德语 ä、西班牙语 ñ 或带变音符号的越南文上排序可能不准。

SumiNote
SumiNote

一款服务留学生的AI学习神器

下载
  • utf8mb4_0900_ai_ci 是 MySQL 8.0 引入的,默认启用 Unicode 9.0.0 标准,ai=accent insensitive,ci=case insensitive,对多语言排序更鲁棒
  • 若需大小写敏感,选 utf8mb4_0900_as_cs;若要兼容旧应用行为,可保留 utf8mb4_unicode_ci,但新项目建议直接用 _0900_ai_ci
  • 验证当前字段 collation:SHOW FULL COLUMNS FROM users LIKE 'name'; → 看 Collation 列是否为 utf8mb4_0900_ai_ci

客户端连接也得配对,否则前功尽弃

就算表和字段全设成 utf8mb4,如果客户端连上来用的是 utf8,MySQL 仍会按 3 字节逻辑解析请求,导致乱码或截断。关键参数有三个:character_set_clientcharacter_set_connectioncharacter_set_results

  • 连接时显式指定(以 MySQL CLI 为例):mysql --default-character-set=utf8mb4 -u root -p
  • 应用层(如 Python PyMySQL)需在连接参数中加:charset='utf8mb4';PHP PDO 加 PDO::MYSQL_ATTR_INIT_COMMAND => "SET NAMES utf8mb4"
  • 检查是否生效:SHOW VARIABLES LIKE 'character_set%'; → 确保 clientconnectionresults 三者均为 utf8mb4

最容易被忽略的是:哪怕数据库、表、列、连接全设对了,如果前端 HTML 没声明 <meta charset="UTF-8">,或者 HTTP 响应头漏了 Content-Type: text/html; charset=utf-8,用户看到的还是方块或问号——字符集是一条链,断哪一环都不行。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
mysql修改数据表名
mysql修改数据表名

MySQL修改数据表:1、首先查看数据库中所有的表,代码为:‘SHOW TABLES;’;2、修改表名,代码为:‘ALTER TABLE 旧表名 RENAME [TO] 新表名;’。php中文网还提供MySQL的相关下载、相关课程等内容,供大家免费下载使用。

682

2023.06.20

MySQL创建存储过程
MySQL创建存储过程

存储程序可以分为存储过程和函数,MySQL中创建存储过程和函数使用的语句分别为CREATE PROCEDURE和CREATE FUNCTION。使用CALL语句调用存储过程智能用输出变量返回值。函数可以从语句外调用(通过引用函数名),也能返回标量值。存储过程也可以调用其他存储过程。php中文网还提供MySQL创建存储过程的相关下载、相关课程等内容,供大家免费下载使用。

452

2023.06.21

mongodb和mysql的区别
mongodb和mysql的区别

mongodb和mysql的区别:1、数据模型;2、查询语言;3、扩展性和性能;4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容,供大家免费下载体验。

286

2023.07.18

mysql密码忘了怎么查看
mysql密码忘了怎么查看

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql密码忘了怎么办呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

519

2023.07.19

mysql创建数据库
mysql创建数据库

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql怎么创建数据库呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

265

2023.07.25

mysql默认事务隔离级别
mysql默认事务隔离级别

MySQL是一种广泛使用的关系型数据库管理系统,它支持事务处理。事务是一组数据库操作,它们作为一个逻辑单元被一起执行。为了保证事务的一致性和隔离性,MySQL提供了不同的事务隔离级别。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

392

2023.08.08

sqlserver和mysql区别
sqlserver和mysql区别

SQL Server和MySQL是两种广泛使用的关系型数据库管理系统。它们具有相似的功能和用途,但在某些方面存在一些显著的区别。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

541

2023.08.11

mysql忘记密码
mysql忘记密码

MySQL是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。那么忘记mysql密码我们该怎么解决呢?php中文网给大家带来了相关的教程以及其他关于mysql的文章,欢迎大家前来学习阅读。

663

2023.08.14

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

48

2026.02.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 2.4万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 842人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号