用jmap抓有效堆快照需避坑:先jstat看gc状态,禁用高峰期强制dump;优先配-xx:+heapdumpbeforefullgc自动捕获;mat报错则升级至1.12+或加version=1.0.0参数;分析时重用dominator tree与多快照对比,警惕finalizer、jni、threadlocal及metaspace泄漏。

怎么用 jmap 抓到真正有用的堆快照
直接跑 jmap -dump:format=b,file=heap.hprof <pid></pid> 很容易失败或抓到“假死”状态——比如应用正在做 Full GC、线程卡在 safepoint,jmap 会等很久甚至超时。更糟的是,它默认触发一次全局 stop-the-world,可能让线上服务雪上加霜。
实操建议:
立即学习“Java免费学习笔记(深入)”;
- 先用
jstat -gc <pid></pid>看当前 GC 频率和老年代使用率,确认不是短期内存抖动 - 加
-F强制模式只在进程无响应时用,但可能导出不一致的快照;优先用-XX:+HeapDumpBeforeFullGCJVM 参数自动捕获 - 导出路径必须有写权限,且磁盘剩余空间 ≥ 当前堆大小的 1.5 倍(
hprof文件通常比运行时堆大 10–20%) - 避免在高峰期执行;如果必须在线抓,用
jmap -histo <pid></pid>先看对象统计,快速定位疑似泄漏类
MAT 打开报错 “Not a valid heap dump” 怎么办
常见于:用 jmap 对 JDK 8u292+ 或 JDK 17+ 进程导出后,MAT(尤其是旧版 1.10 之前)解析失败。根本原因是 JVM 默认启用了压缩指针(-XX:+UseCompressedOops),而某些 MAT 版本没正确处理新版 HPROF 格式头信息。
实操建议:
立即学习“Java免费学习笔记(深入)”;
- 升级 MAT 到 1.12+(Eclipse 官方最新版),它已支持 JDK 17 的堆格式
- 导出时显式指定协议版本:
jmap -dump:format=b,file=heap.hprof,version=1.0.0 <pid></pid>(兼容性最强) - 若仍报错,用
file heap.hprof检查文件头是否含JAVA PROFILE 1.0.2;若显示data或乱码,说明导出被截断,检查磁盘满或权限问题 - 别用文本编辑器打开
.hprof文件——它不是文本,强行查看会损坏二进制结构
在 MAT 里一眼看出谁在吃内存
MAT 默认的 “Leak Suspects Report” 只是启发式猜测,常漏掉静态集合缓存、ThreadLocal 持有、未注销监听器等典型泄漏源。得手动看 “Dominator Tree” 和 “Histogram” 配合验证。
实操建议:
立即学习“Java免费学习笔记(深入)”;
- 打开 “Dominator Tree”,按 “Retained Heap” 降序,重点关注非
java.lang.*和非框架类(如com.yourcompany.cache.DataHolder) - 右键可疑类 → “Merge Shortest Paths to GC Roots”,勾选 “exclude weak/soft/phantom references”,看哪些强引用链没断
- 对比多个快照:用 “Compare Basket” 功能载入 t1.hprof 和 t2.hprof,筛选 “Objects added since t1”,找持续增长的对象实例
- 注意
char[]和byte[]的 retained heap —— 它们常被字符串、JSON 解析器、日志缓冲区间接持有,实际泄漏源头可能在上层业务类
为什么修复后内存还是不降?
改了代码、清了缓存、关了监听器,但下次 Full GC 后老年代占用没明显下降——大概率是对象没被回收,但 MAT 显示 “GC Root” 已断。这时候要怀疑:是不是对象还在 finalize 队列里排队?或者被 finalizer 线程卡住?又或者用了 JNI 引用没释放?
实操建议:
立即学习“Java免费学习笔记(深入)”;
- 在 MAT 的 “Histogram” 中搜索
java.lang.ref.Finalizer,看数量是否异常增长(JDK 9+ 已废弃,但存量系统仍有) - 用
jstack <pid></pid>查 finalizer 线程栈,确认是否阻塞在某个finalize()方法里 - JNI 场景下,
jmap -finalizerinfo <pid></pid>能列出待终结对象数,但无法定位 C 层引用;需结合valgrind --tool=memcheck(Linux)或 JVM TI agent 排查 - 有些泄漏藏在
ThreadLocalMap里:MAT 中搜java.lang.ThreadLocal$ThreadLocalMap,再看其table字段里的 value 是否指向业务对象(尤其 Web 容器线程池复用场景)
最麻烦的情况是:泄漏点不在 Java 堆,而在 Metaspace 或直接内存。这时候 jmap -clstats <pid></pid> 和 jstat -gcmetacapacity <pid></pid> 才是关键,别一头扎进 heap.hprof 白忙活。










