0

0

Java中的类文件结构中的常量池类型_Utf8, Integer, Class等标记解析

P粉602998670

P粉602998670

发布时间:2026-02-27 12:57:10

|

786人浏览过

|

来源于php中文网

原创

constant_utf8_info采用modified utf-8编码,空字符\u0000编码为0xc0 0x80,需手动处理;其长度字段为2字节无符号short,表示字节数而非字符数。

java中的类文件结构中的常量池类型_utf8, integer, class等标记解析

常量池中 CONSTANT_Utf8_info 的实际字节布局和编码陷阱

Java class 文件里的 CONSTANT_Utf8_info 不是标准 UTF-8,而是“modified UTF-8”:空字符 \u0000 被编码为 0xC0 0x80,而 ASCII 字符(0x01–0x7F)仍用单字节。读取时若直接用 new String(bytes, "UTF-8") 解码,会把 0xC0 0x80 当作非法序列抛 MalformedInputException

  • 解析时必须手动处理 0xC0 0x80\u0000,其余按 UTF-8 解码;JDK 自带的 DataInputStream.readUTF() 可复用,但它读的是“Java modified UTF-8”,且只适用于 class 文件中以两字节长度开头的字符串(即 CONSTANT_Utf8_info 的格式)
  • 常见错误:用 Files.readString(path, StandardCharsets.UTF_8) 直接读 class 文件中的 Utf8 字段 —— 这会跳过长度前缀、忽略修改规则,必然失败
  • 注意:class 文件中 CONSTANT_Utf8_info 的长度字段是无符号 short(2 字节),表示后续字节数,不是字符数;一个中文字符可能占 3 字节,但长度字段只计 3

CONSTANT_Integer_infoCONSTANT_Float_info 的字节序与类型混淆

这两个常量类型都占 5 个字节:1 字节 tag + 4 字节值,且值都是 big-endian。但它们在运行时常量池里被当作不同语义对待——CONSTANT_Integer_info 是整型字面量,CONSTANT_Float_info 是浮点字面量,哪怕二进制完全一样(比如 0x3F800000 在 Integer 中是 1065353216,在 Float 中是 1.0)。

  • 解析时不能只看 tag 就认为“4 字节就是 int”;必须严格按 tag 分支处理:tag == 3 → CONSTANT_Integer_infoByteBuffer.getInt();tag == 4 → CONSTANT_Float_infoByteBuffer.getFloat()
  • 容易踩坑:把 CONSTANT_Float_info 的 4 字节当成 int 解析后强转 float,会得到完全错误的值(例如 0x3F800000 当 int 是 1065353216,转 float 是 1.065353216E9)
  • 兼容性注意:JVM 规范要求所有数值常量都用 big-endian,不依赖 host 平台字节序;手写解析器务必用 ByteBuffer.order(ByteOrder.BIG_ENDIAN)

CONSTANT_Class_info 的 name_index 指向的是 Utf8,不是类名字符串本身

CONSTANT_Class_info 结构只有两个字段:tag(=7)和 name_index(2 字节),它本身不存类名,只是个指针。真正类名藏在另一个 CONSTANT_Utf8_info 条目里,由 name_index 索引过去。

Spell.tools
Spell.tools

高颜值AI内容营销创作工具

下载
  • 解析时必须做两次查表:先读 name_index,再用该值作为下标去常量池数组里取对应 CONSTANT_Utf8_info 条目,最后解码其字节内容
  • 常见错误:把 name_index 当成类名偏移或直接当字符串用;或者忽略常量池索引从 1 开始(第 0 项无效),导致数组越界或读错条目
  • 路径风格注意:class 文件中类名用 / 分隔,如 java/lang/Object,不是 .;反编译工具显示的 java.lang.Object 是展示层转换,原始常量池里永远是斜杠

常量池索引溢出和解析顺序对 CONSTANT_Methodref_info 的影响

CONSTANT_Methodref_info(tag = 10)含三个索引:class_indexname_and_type_index,后者又指向一个 CONSTANT_NameAndType_info,里面再含两个索引:name_indexdescriptor_index。四层嵌套,任意一级索引越界或指向非法 tag,都会让整个方法引用失效。

立即学习Java免费学习笔记(深入)”;

  • 必须逐级验证:先确认 class_index 指向 CONSTANT_Class_info,再确认 name_and_type_index 指向 CONSTANT_NameAndType_info,再分别验证其内部两个索引是否指向 CONSTANT_Utf8_info
  • 容易忽略:class 文件规范允许常量池中存在“未使用”的条目(比如 CONSTANT_Long_infoCONSTANT_Double_info 占两个槽位,后一槽无效),所以索引不能简单等于数组下标;需按实际条目数动态计算有效索引范围
  • 性能提示:全量预解析常量池比边用边查快,尤其对频繁反射或字节码分析场景;但首次加载 class 时若只关心某个方法,可延迟解析相关链路,避免冗余开销
事情说清了就结束。最麻烦的从来不是单个常量类型,而是它们之间靠索引形成的隐式依赖链 —— 一处索引错,整条链崩,而且错误表现常常是“找不到方法”或“类名乱码”,而不是明确的解析异常。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

850

2023.08.02

css中float用法
css中float用法

css中float属性允许元素脱离文档流并沿其父元素边缘排列,用于创建并排列、对齐文本图像、浮动菜单边栏和重叠元素。想了解更多float的相关内容,可以阅读本专题下面的文章。

592

2024.04.28

C++中int、float和double的区别
C++中int、float和double的区别

本专题整合了c++中int和double的区别,阅读专题下面的文章了解更多详细内容。

105

2025.10.23

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1560

2023.10.24

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

638

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

218

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1560

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

643

2023.11.24

html5播放器怎么用
html5播放器怎么用

本合集全面介绍HTML5播放器的使用方法,涵盖基础语法、自定义控制、兼容性处理及实战示例。阅读专题下面的文章了解更多详细内容。

0

2026.02.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 3.9万人学习

C# 教程
C# 教程

共94课时 | 10.2万人学习

Java 教程
Java 教程

共578课时 | 72.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号