0

0

在Java里Charsets如何转换字符编码_Java字符集转换工具说明

P粉602998670

P粉602998670

发布时间:2026-02-13 12:37:29

|

787人浏览过

|

来源于php中文网

原创

优先使用standardcharsets.utf_8等静态常量,因其零开销、线程安全、编译期校验;charset.forname()需运行时解析且可能抛异常,仅在动态编码名场景下配合try-catch使用。

在java里charsets如何转换字符编码_java字符集转换工具说明

Java里用Charset.forName()还是StandardCharsets?

直接结论:优先用 StandardCharsets 中的静态常量(如 StandardCharsets.UTF_8),而不是 Charset.forName("UTF-8")。前者零开销、线程安全、编译期校验;后者会触发类加载和字符串解析,可能抛出 UnsupportedCharsetException,且拼写错误只能到运行时才发现。

常见误用场景:从配置文件读取编码名再调用 Charset.forName(config.get("charset"))——这时必须加 try-catch,并 fallback 到默认值(如 StandardCharsets.UTF_8)。

  • 所有 JDK 7+ 支持的字符集,StandardCharsets 都已预定义,包括 US_ASCIIISO_8859_1UTF_8UTF_16UTF_16BEUTF_16LE
  • Charset.availableCharsets() 返回的是 JVM 实际支持的映射表(含别名),但不建议遍历它做动态选择——别名不统一(如 "UTF8"、"utf-8"、"UTF-8" 都可能被接受,但行为未必一致)

byte[] ↔ String 转换时最容易踩的坑

核心问题:不显式指定 Charset,依赖平台默认编码。Windows 上是 GBK,Linux/macOS 通常是 UTF-8,同一段代码在不同环境输出乱码或解析失败。

正确写法永远带 Charset 参数:

立即学习Java免费学习笔记(深入)”;

String s = new String(bytes, StandardCharsets.UTF_8); // ✅
byte[] b = s.getBytes(StandardCharsets.UTF_8);         // ✅

反例(危险):

聪豹Wiseal
聪豹Wiseal

聪豹Wiseal是一个专业的历史时间线收集整理工具

下载
String s = new String(bytes);           // ❌ 用系统默认
byte[] b = s.getBytes();                // ❌ 同上
  • 涉及 I/O 时同理:InputStreamReaderOutputStreamWriterFiles.readAllLines(path, charset) 必须传 Charset
  • String.getBytes() 不带参数时,返回的是平台默认编码的字节,不是 UTF-8 —— 即使你的源文件是 UTF-8 编码,也不代表运行时默认就是 UTF-8
  • HTTP 场景下,Content-Type: text/plain; charset=gbk 中的 charset 值需手动提取并转成 Charset 对象,不能硬编码

需要“转换编码”时,其实只是重新解释字节序列

Java 没有内置的“UTF-8 → GBK 字符集转换函数”。所谓转换,本质是:先按原编码解码成 String,再按目标编码编码回 byte[]。中间 String 是 Unicode 抽象表示,不绑定任何字节格式。

例如把 GBK 字节转为 UTF-8 字节:

byte[] gbkBytes = ...;
String s = new String(gbkBytes, StandardCharsets.GBK);     // 先用 GBK 解码
byte[] utf8Bytes = s.getBytes(StandardCharsets.UTF_8);     // 再用 UTF-8 编码
  • 如果原始字节实际不是 GBK 编码(比如本是 UTF-8 却用 GBK 解),new String(..., GBK) 会产生或异常字符,后续转 UTF-8 也无法恢复
  • 不推荐用 CharsetDecoder/CharsetEncoder 手动处理,除非要控制替换策略(如 CodingErrorAction.REPLACE)或流式处理超大文本
  • 第三方库如 Apache Commons Codec 的 StringUtils 或 Guava 的 Charsets 并未提供更底层的转换能力,只是封装了上述两步

跨语言/网络传输时 Charset 名称怎么写才可靠?

HTTP、XML、数据库连接字符串等外部协议中传递编码名,必须用 IANA 注册名称(如 UTF-8ISO-8859-1),不能用 JDK 别名(如 UTF8Latin-1)。

JDK 内部对大小写和横线不敏感(Charset.forName("utf8")"UTF-8" 等价),但外部系统往往严格匹配。

  • XML 声明必须写 <?xml version="1.0" encoding="UTF-8"?>,写成 utf8UTF8 可能被某些解析器拒绝
  • JDBC URL 中 useUnicode=true&characterEncoding=utf8 是 MySQL 驱动的特例(它接受小写无横线),但标准做法仍是 characterEncoding=UTF-8
  • 检查 Charset.isSupported("UTF-8") 可以提前发现非法名称,但注意它不校验是否为 IANA 标准名,只查 JVM 是否注册了该别名

真正难的不是写法,而是确认源头数据到底用的什么编码——没有元信息时,只能靠统计或 BOM 推断,这部分 Java 标准库不提供支持。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
mysql修改数据表名
mysql修改数据表名

MySQL修改数据表:1、首先查看数据库中所有的表,代码为:‘SHOW TABLES;’;2、修改表名,代码为:‘ALTER TABLE 旧表名 RENAME [TO] 新表名;’。php中文网还提供MySQL的相关下载、相关课程等内容,供大家免费下载使用。

674

2023.06.20

MySQL创建存储过程
MySQL创建存储过程

存储程序可以分为存储过程和函数,MySQL中创建存储过程和函数使用的语句分别为CREATE PROCEDURE和CREATE FUNCTION。使用CALL语句调用存储过程智能用输出变量返回值。函数可以从语句外调用(通过引用函数名),也能返回标量值。存储过程也可以调用其他存储过程。php中文网还提供MySQL创建存储过程的相关下载、相关课程等内容,供大家免费下载使用。

351

2023.06.21

mongodb和mysql的区别
mongodb和mysql的区别

mongodb和mysql的区别:1、数据模型;2、查询语言;3、扩展性和性能;4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容,供大家免费下载体验。

284

2023.07.18

mysql密码忘了怎么查看
mysql密码忘了怎么查看

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql密码忘了怎么办呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

519

2023.07.19

mysql创建数据库
mysql创建数据库

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql怎么创建数据库呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

262

2023.07.25

mysql默认事务隔离级别
mysql默认事务隔离级别

MySQL是一种广泛使用的关系型数据库管理系统,它支持事务处理。事务是一组数据库操作,它们作为一个逻辑单元被一起执行。为了保证事务的一致性和隔离性,MySQL提供了不同的事务隔离级别。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

391

2023.08.08

sqlserver和mysql区别
sqlserver和mysql区别

SQL Server和MySQL是两种广泛使用的关系型数据库管理系统。它们具有相似的功能和用途,但在某些方面存在一些显著的区别。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

536

2023.08.11

mysql忘记密码
mysql忘记密码

MySQL是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。那么忘记mysql密码我们该怎么解决呢?php中文网给大家带来了相关的教程以及其他关于mysql的文章,欢迎大家前来学习阅读。

635

2023.08.14

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

1

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 3.5万人学习

C# 教程
C# 教程

共94课时 | 9.3万人学习

Java 教程
Java 教程

共578课时 | 64.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号