Java char 类型与 Unicode 编码关系解析

冰川箭仙

发布时间：2026-03-18 14:37:47

942人浏览过

来源于php中文网

原创

Java中char是16位无符号整数，取值0–65535，仅能表示Unicode基本多文种平面（BMP）字符；超出BMP的辅助平面字符需用UTF-16代理对（两个char）表示，操作时应使用codePoint相关API而非charAt等char级方法。

java char 类型与 unicode 编码关系解析

Java 中的 char 类型本质上是一个 16 位无符号整数，取值范围是 0 到 65535（即 0x0000 到 0xFFFF），它最初被设计为直接对应 Unicode 基本多文种平面（BMP, Basic Multilingual Plane）中的一个字符。但随着 Unicode 标准扩展，大量字符（如 emoji、古汉字、部分少数民族文字）被放入辅助平面（Supplementary Planes），超出了 char 的表示能力——这就引出了 char 与 Unicode 编码之间既紧密又受限的关系。

char 只能表示 BMP 内的 Unicode 码点

Unicode 将字符映射到称为“码点”（code point）的整数值上，例如 'A' 是 U+0041，'中' 是 U+4E2D。BMP 覆盖了 U+0000 到 U+FFFF，恰好可用一个 char 存储。因此，所有 ASCII 字符、常见汉字、拉丁字母、希腊字母等都在此范围内，用 char 表示毫无问题。

但像 ?（U+1F30D）、?（U+1FAB7）或某些生僻汉字（如 U+20000 以上的“?”）都位于辅助平面（U+10000 ~ U+10FFFF），无法用单个 char 表示。

超出 BMP 的字符需用两个 char 表示（代理对）

Java 采用 UTF-16 编码方案存储字符串。对于辅助平面的码点，UTF-16 使用一对 16 位值：一个高位代理（high surrogate，范围 U+D800–U+DBFF）和一个低位代理（low surrogate，范围 U+DC00–U+DFFF）。这两个 char 合起来才表示一个完整字符。

立即学习“Java免费学习笔记（深入）”；

一点PPT

一句话生成专业PPT，AI自动排版配图

下载

例如：U+1F30D（?）被编码为 0xD83C 和 0xDF0D 两个 char
String.length() 返回的是 char 数量，不是字符数；对含 emoji 的字符串调用 length() 可能返回 2，但实际只含 1 个字符
使用 String.codePointCount(0, str.length()) 才能得到真实字符数

操作字符应优先使用 codePoint 相关 API

直接对 char 进行遍历或判断容易出错，尤其在处理 emoji 或扩展汉字时。Java 提供了基于码点的操作方法：

用 String.codePointAt(int index) 替代 charAt() 获取指定位置的完整码点（返回 int）
用 String.offsetByCodePoints(int start, int offset) 安全跳过一个或多个字符
用 Character.isSupplementaryCodePoint(int cp) 判断是否为辅助平面码点
用 Character.toChars(int cp) 将码点转为 char 数组（可能长度为 1 或 2）

char 本质是数值，不是“字符对象”

char 是基本类型，不带语义。它可参与算术运算（如 'a' + 1 → 'b'），也可强制转换为 int 查看其 Unicode 值（如 (int)'中' 得 20013）。但要注意：把一个辅助平面码点强行转成 char 会丢失高位信息，仅保留低 16 位，结果不可预测。

例如：(char)0x1F30D 实际得到的是 0xF30D（即 U+F30D，一个完全无关的私用区字符），而非 ?。

Java 程序运行时类路径搜索顺序详解

Java中的LockSupport与wait/notify的区别_不需要同步块及unpark可提前发放许可机制

如何在Java中利用CompletableFuture串行执行多个异步任务_thenApply与thenAccept实战

如何在 Java 中通过用户输入初始化对象属性并正确调用 set 方法

如何配置Tomcat服务器_在IDEA中部署Java Web项目全流程

相关标签:

java String 字符串 char int Length 对象 ASCII

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Java 接口使用 interface 关键字的完整定义语法下一篇：暂无

作者最新文章

Linux端口被占用怎么查_lsof命令定位端口进程

2026-03-17 12:56

Java 一维数组元素访问越界异常 ArrayIndexOutOfBoundsException

2026-03-17 13:03

MacOS 系统透明代理网关配置与流量重定向技术细节

2026-03-17 13:07

MySQL 索引选择性面试考点

2026-03-17 13:11

潜水员戴夫员工料理员工料理加成与使用技巧

2026-03-17 13:24

如何准备Nginx编译环境：GCC、OpenSSL及PCRE依赖安装教程

2026-03-17 13:49

Nginx模块化编译指南：如何剔除无用功能以减小体积教程

2026-03-17 13:54

Linux系统文件锁机制原理及在多进程环境下并发读写控制

2026-03-17 14:12

MacOS系统活动监视器窗口字段自定义与刷新频率设置

2026-03-17 14:22

Linux环境下分析进程陷入不可中断D状态的常见诱因

2026-03-17 14:26

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

string转int

在编程中，我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算，或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

1091

2023.08.02

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

761

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

221

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1571

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

652

2023.11.24

java读取文件转成字符串的方法

Java8引入了新的文件I/O API，使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java，可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中，你需要将文件路径替换为你的实际文件路径，并且可能需要处理可能的IOException异常。想了解更多java的相关内容，可以阅读本专题下面的文章。

1269

2024.03.22

php中定义字符串的方式

php中定义字符串的方式：单引号；双引号；heredoc语法等等。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

1226

2024.04.29

go语言字符串相关教程

本专题整合了go语言字符串相关教程，阅读专题下面的文章了解更多详细内容。

194

2025.07.29

Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践，系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例，帮助开发者构建高效稳定的实时通信系统，适用于聊天应用、实时数据推送等场景。

2026.03.18

热门下载

网站特效

网站源码

网站素材

前端模板