0

0

在Java里字符类型char如何使用_char编码规则解析

P粉602998670

P粉602998670

发布时间:2026-01-08 17:15:09

|

105人浏览过

|

来源于php中文网

原创

java中char是16位utf-16编码单元,可表示bmp字符(如'中'),但辅助平面字符(如?)需代理对;操作字符串应使用codepointcount、codepoints等api而非charat/length。

在java里字符类型char如何使用_char编码规则解析

Java 中的 char 是16位无符号整数类型,用于表示单个 Unicode 字符,底层采用 UTF-16 编码规则。它不是 ASCII 的简单扩展,而是能表达更广泛字符(包括中文、emoji、数学符号等)的基础类型。

char 的本质:UTF-16 编码单元

char 在 JVM 内部占 2 字节(0x0000 ~ 0xFFFF),对应一个 UTF-16 编码单元(code unit)。注意:它不等于“一个字符(character)”——某些 Unicode 字符(如大部分 emoji 或古汉字)需要两个 char(即一个代理对,surrogate pair)才能完整表示。

  • 基本多文种平面(BMP,U+0000 ~ U+FFFF)内的字符:用 1 个 char 表示,例如 'A''中''€'
  • 辅助平面(U+10000 及以上)的字符:需用 2 个 char 组成代理对,例如 ?(U+1F30D)→ '\uD83C' + '\uDF0D'
  • 直接写法:char c = '中';char c = '\u4F26';(Unicode 转义)、char c = 20013;(十进制码点值)

char 与字符串、码点的正确交互

String 处理字符时,不能简单依赖 charAt()length() 来统计“字符个数”,因为它们操作的是 char 单元,而非逻辑字符(grapheme cluster)。

Dora
Dora

创建令人惊叹的3D动画网站,无需编写一行代码。

下载
  • "?".length() 返回 2(两个 char),但实际是 1 个字符
  • 获取真实字符数:用 string.codePointCount(0, string.length())
  • 安全遍历字符:用 string.codePoints().forEach(...) 或手动配合 Character.isHighSurrogate()/isLowSurrogate()
  • 从码点构造字符:若码点 ≤ 0xFFFF,可用 (char) codePoint;否则需拆为代理对,推荐用 Character.toChars(codePoint) 返回 char[]

常见误区与注意事项

开发中容易忽略 char 的 UTF-16 特性,导致乱码或越界问题。

立即学习Java免费学习笔记(深入)”;

  • 误把 char 当作“字节”:它永远是 2 字节,和文件编码(如 UTF-8)无关;读写文本时应使用 InputStreamReader/OutputStreamWriter 指定 charset
  • 字符串拼接中混用 charint:如 'a' + 1 结果是 98(int 类型),不是 'b';要转回 char 需显式强转:(char)('a' + 1)
  • 正则或比较时忽略代理对:如 String.substring() 可能切开代理对,造成无效字符;建议用 String.offsetByCodePoints() 定位
  • JSON/网络传输中:Java char 序列化为 JSON 字符串时,会自动转义非 ASCII 字符(如 "\u4F26"),无需手动处理

实用小技巧

快速验证和调试 char 相关逻辑:

  • 打印字符的 Unicode 码点:System.out.printf("U+%04X%n", (int)'中');
  • 判断是否为代理对中的高/低位:Character.isSurrogate(c)Character.isHighSurrogate(c)
  • 将字符串转为码点流查看:str.codePoints().mapToObj(Integer::toHexString).forEach(System.out::println);
  • 安全截取前 N 个字符(按逻辑字符):str.substring(0, str.offsetByCodePoints(0, N));

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

455

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

546

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

334

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

82

2025.09.10

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1010

2023.08.02

php中foreach用法
php中foreach用法

本专题整合了php中foreach用法的相关介绍,阅读专题下面的文章了解更多详细教程。

266

2025.12.04

printf用法大全
printf用法大全

php中文网为大家提供printf用法大全,以及其他printf函数的相关文章、相关下载资源以及各种相关课程,供大家免费下载体验。

76

2023.06.20

fprintf和printf的区别
fprintf和printf的区别

fprintf和printf的区别在于输出的目标不同,printf输出到标准输出流,而fprintf输出到指定的文件流。根据需要选择合适的函数来进行输出操作。更多关于fprintf和printf的相关文章详情请看本专题下面的文章。php中文网欢迎大家前来学习。

304

2023.11.28

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

3

2026.03.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.3万人学习

C# 教程
C# 教程

共94课时 | 11.1万人学习

Java 教程
Java 教程

共578课时 | 80.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号