java对象在堆中分为对象头、实例数据、对齐填充三部分;对象头含mark word和class pointer;实例数据按字段宽度分组排列;引用变量存于栈或堆,指向堆中对象地址。

对象实例在堆里的内存结构长什么样
Java 对象在堆中不是“一块平铺的内存”,而是分三块:对象头、实例数据、对齐填充。对象头里又含 Mark Word(锁状态、GC 分代年龄、哈希码)和 Class Pointer(指向 Klass 元数据)。实例数据才是你声明的 int x、String name 真正存的地方,按字段宽度和继承顺序排列,JVM 可能重排序(比如把两个 byte 挤一起),但不会跨父类边界乱动。
常见错误是以为 new Object() 就占 8 字节——实际在 64 位 JVM(开启指针压缩)下,它至少占 16 字节:12 字节对象头 + 4 字节对齐填充。你可以用 Unsafe.objectFieldOffset() 或 JOL(Java Object Layout)工具验证,别靠猜。
- 启用指针压缩(默认开启)时,Class Pointer 占 4 字节;关闭后变成 8 字节,对象头整体变大
- 数组对象多一个 4 字节的 length 字段,放在对象头之后、实例数据之前
- 子类字段不一定紧跟父类字段——JVM 优先按宽度分组(long/double → int → short/char → byte/boolean),再考虑继承顺序
引用变量到底存在哪?栈上还是堆上
Object obj = new Object(); 这行里,obj 是局部变量,存于当前线程的虚拟机栈帧的局部变量表中;它本身只是个 4 字节(压缩)或 8 字节(未压缩)的引用值,内容是堆中那个对象的起始地址。这个引用不是对象,也不是指针别名,就是个“地址快照”——如果 GC 移动了对象,这个引用值会被 JVM 的写屏障机制悄悄更新。
容易踩的坑:以为 obj 在堆里,或者认为它和 C 的指针一样可做算术运算。它不能解引用、不能加减、不能转成 long 拿来当地址用(除非用 Unsafe,但那是另一套规则)。
- 成员变量(非 static)的引用字段,和它所属的对象一起存在堆上,属于实例数据的一部分
- static 字段的引用,存在方法区(JDK 8+ 是元空间)的类元数据结构里,不随对象生命周期变化
- 逃逸分析后,若确定引用不会被外部访问,JVM 可能把对象直接分配到栈上(标量替换),此时“引用”和“对象”都在栈帧里——但这对 Java 代码完全透明
从引用到对象的完整寻址链条
当你写 obj.toString(),JVM 干的事是:栈上取 obj 的值 → 解释为堆内存地址 → 检查该地址是否在 GC 堆范围内 → 读取该地址处的对象头 → 从中取出 Class Pointer → 查 Klass 结构里的 vtable 或 itable → 找到 toString 方法入口 → 调用。整个链条依赖三个关键环节:引用值有效性、对象头完整性、元数据可达性。
一旦中间某环断掉,就会触发不同错误:引用为 null 抛 NullPointerException;对象已被回收但引用没清(不可能,有 GC 根扫描和写屏障保障);类卸载后调用方法抛 NoClassDefFoundError(注意不是 ClassNotFoundException)。
- 引用值如果是 0(null),JVM 在方法调用前就检查并抛异常,不走到对象头读取那步
- 对象头里的 Class Pointer 永远指向有效的
Klass,哪怕类被重新加载——新类会生成新Klass,老对象仍连着旧的 - GC 移动对象时,所有指向它的引用(栈上、堆上、常量池里)都会被并发标记-清除阶段统一修正,这个过程对应用线程不可见
为什么 String、Integer 这些看起来像“直接存值”的对象也走这套链条
它们不是特例,只是被设计成不可变且常量化了。String s = "abc" 中,s 还是栈上引用,指向堆里一个真正的 String 实例;而这个实例的 value 字段(JDK 9+ 是 byte[])又是指向另一个堆对象。所谓“字符串常量池”,只是 JVM 维护的一张哈希表,key 是字符内容,value 是堆中对应 String 对象的引用——池里存的仍是引用,不是字符串本体。
有人误以为 Integer.valueOf(127) 返回的是“栈上小整数”,其实它返回的是堆里缓存的 Integer 实例的引用;只有 -128 到 127 范围内才复用,超出就 new 新对象。这和引用存储链条无关,只影响对象数量。
-
String的value字段是引用类型(byte[]或char[]),所以字符串内容本身也在堆上,不在字符串对象内部“内联” - 自动装箱如
int i = 5; Integer n = i;,n是栈上引用,指向堆中Integer实例;i才是真正在栈帧里存的 4 字节值 - final 字段不影响引用存储位置——它只约束后续赋值行为,不改变字段本身的内存布局










