
查看当前字符集设置
在调整之前,先确认当前MySQL的字符集配置:
SHOW VARIABLES LIKE 'character_set_%';
SHOW VARIABLES LIKE 'collation_%';重点关注以下变量:
- character_set_client:客户端发送语句使用的字符集
- character_set_connection:连接层使用的字符集
- character_set_database:当前数据库默认字符集
- character_set_server:服务器默认字符集
- character_set_results:查询结果返回的字符集
设置服务器级别字符集
最根本的方法是在MySQL配置文件中统一设置默认字符集。配置文件通常为:- Linux: /etc/my.cnf 或 /etc/mysql/my.cnf
- Windows: my.ini
[mysqld] character-set-server = utf8mb4 collation-server = utf8mb4_unicode_ci保存后重启MySQL服务生效。 注意:推荐使用utf8mb4而非utf8,因为MySQL的utf8是伪UTF-8,最多支持3字节,无法存储emoji等4字节字符;而utf8mb4才是真正的UTF-8实现。
创建数据库和表时指定字符集
在创建数据库时显式指定字符集:CREATE DATABASE mydb CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;建表时也可以单独设置:
CREATE TABLE users ( id INT PRIMARY KEY, name VARCHAR(100) ) ENGINE=InnoDB CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;如果不指定,则继承数据库或服务器的默认设置。
修改已有对象的字符集
若需更改现有数据库或表的字符集,可用ALTER命令:ALTER DATABASE mydb CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
ALTER TABLE users CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;此操作会重新构建表结构并转换数据,建议在低峰期执行,并提前备份。
连接时设置字符集
应用程序连接MySQL时也应声明正确的字符集。例如:-
PHP(PDO):
$pdo = new PDO($dsn, $user, $pass, [ PDO::MYSQL_ATTR_INIT_COMMAND => "SET NAMES utf8mb4" ]); - Java(JDBC)**:
jdbc:mysql://localhost:3306/mydb?characterEncoding=utf8mb4
- 命令行客户端**:
登录时加上默认字符集:
mysql -u root -p --default-character-set=utf8mb4
验证设置是否生效
完成配置后再次运行:SHOW VARIABLES LIKE 'character_set_%';确保关键变量均为utf8mb4。同时插入一条包含中文或emoji的数据测试显示效果。 基本上就这些。只要从配置文件、数据库、表、连接四个层面统一使用utf8mb4,就能有效避免乱码问题。










