如何在Java中压缩和解压ZIP文件_ZipOutputStream与ZipInputStream实战

P粉602998670

发布时间：2026-03-17 14:30:31

170人浏览过

来源于php中文网

原创

ZipOutputStream解压后为空目录的根本原因是未调用closeEntry()；目录条目也需调用，且不能依赖close()自动补全。

如何在java中压缩和解压zip文件_zipoutputstream与zipinputstream实战

ZipOutputStream写入文件时为什么解压后是空目录？

根本原因是没调用 closeEntry() —— 很多人只写了 putNextEntry() 就直接写数据，忘了收尾。ZIP格式要求每个条目必须显式关闭，否则解压工具认为该条目没结束，跳过或当成损坏处理。

常见错误现象：unzip 命令报 invalid compressed data to inflate，或者 Windows 解压后看到一堆空文件夹。

必须在写完一个文件内容后立即调用 zos.closeEntry()
如果写的是目录（路径以 / 结尾），putNextEntry() 后不能写任何字节，但依然要调用 closeEntry()
别依赖 zos.close() 自动补全——它不会帮你关未完成的条目

zos.putNextEntry(new ZipEntry("src/"));
// 目录不写内容，但必须 close
zos.closeEntry(); // ← 这行不能省

ZipInputStream读取时 getInputStream() 返回 null 怎么办？

不是流坏了，是当前 ZipEntry 本身不带数据——比如它是目录、或压缩方式为 STORED 但实际长度为 0。Java 的 ZipInputStream 对这类条目会返回 null，而不是抛异常。

使用场景：遍历 ZIP 内容做条件提取（比如只解压 .log 文件），容易在这里卡住。

立即学习“Java免费学习笔记（深入）”；

ProcessOn

免费在线流程图思维导图，专业强大的作图工具，支持多人实时在线协作

下载

先检查 ze.getSize() != 0 或 ze.isDirectory() == false
再判断 ze.getMethod() == ZipEntry.STORED 且 ze.getCrc() == 0，可能也是空条目
永远用 if (in != null) 包一层再读，别直接 in.read(...)

ZipEntry ze = zis.getNextEntry();
if (ze != null && !ze.isDirectory() && ze.getSize() > 0) {
    InputStream in = zis.getInputStream(); // 此时才安全
}

中文文件名乱码（Windows 上最常见）

标准 ZIP 规范不强制指定编码，默认按系统 locale 解释文件名。JDK 原生 ZipInputStream/ZipOutputStream 只支持 UTF-8（从 Java 7 开始可配，但默认关着），而 Windows 默认用 GBK 打包的 ZIP，一读就变问号。

兼容性影响：用 java.util.zip 读老 ZIP 几乎必乱码；用 org.apache.commons.compress 可控，但得手动设编码。

写 ZIP 时，强制用 UTF-8：设置系统属性 -Dsun.zip.encoding=UTF-8（仅 Java 7+ 有效）
更稳的做法：改用 org.apache.commons.compress.archivers.zip.ZipArchiveOutputStream，调用 setEncoding("UTF-8")
读 ZIP 时，如果已知是 GBK 打包的，只能用 ZipArchiveInputStream 并指定 setEncoding("GBK")

大文件压缩内存爆掉或卡死

ZipOutputStream 本身不缓存整个文件，但如果你把大文件一次性读进 byte[] 再写，就等于双倍内存占用。另外，没设缓冲区大小会导致频繁小块 IO，慢到像卡住。

性能影响：100MB 文件用 1KB 缓冲区，IO 次数多 10 万倍；用 8KB 是合理起点。

永远用 byte[] buffer = new byte[8192] 分块读写
别用 Files.readAllBytes() 加载大文件进内存
压缩级别别盲目设 Deflater.BEST_COMPRESSION，对 CPU 和时间消耗陡增，收益却很小

byte[] buf = new byte[8192];
int len;
while ((len = fis.read(buf)) != -1) {
    zos.write(buf, 0, len); // 分块写，不攒整块
}

事情说清了就结束。真正难的不是 API 调用，是那些没报错却让 ZIP 在不同环境里行为分裂的细节——比如空条目、编码隐含假设、缓冲区大小和压缩级别的组合效应。

如何使用Java的FutureTask手动管理异步任务_生命周期管理

如何在Java中获取线程池的运行状态与监控数据_getCompletedTaskCount与动态调参实战

Java中的TreeSet怎么用_红黑树实现与元素自然排序及定制排序机制

Java中的垃圾回收算法有哪些_标记清除、复制算法与标记整理对比

Java clone 方法浅拷贝数组的特性与局限性解析

相关标签:

java NULL if 堆 windows apache

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何在Spring Boot中自定义拦截器(Interceptor)实现HandlerInterceptor拦截请求下一篇：暂无

作者最新文章

Python笛卡尔积怎么求_itertools.product多列表嵌套

2026-03-17 09:33

NumPy条件替换怎么做_np.where(condition, x, y)三元表达式向量化

2026-03-17 09:34

如何在Golang中实现SQLite的加密存储 Go语言SQLCipher集成

2026-03-17 09:34

SQL中LEFT JOIN与INNER JOIN区别_数据取舍原则与场景选择

2026-03-17 09:34

Redis如何清理失效的位置数据_利用ZREM指令删除Geo结构中的坐标点

2026-03-17 09:35

CSS如何使用反选伪类简化选择器

2026-03-17 09:35

宝塔面板下phpMyAdmin登录提示“#1862 密码过期”如何修改？

2026-03-17 09:36

mysql如何配置多线程并行回放类型_mysql slave_parallel_type选择

2026-03-17 09:37

MongoDB中可以使用布尔值或枚举值作为分片键吗_极低基数导致无法分块的严重错误

2026-03-17 09:38

mysql如何管理大批量用户的权限_mysql基于角色的权限模板

2026-03-17 09:38

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

c语言中null和NULL的区别

c语言中null和NULL的区别是：null是C语言中的一个宏定义，通常用来表示一个空指针，可以用于初始化指针变量，或者在条件语句中判断指针是否为空；NULL是C语言中的一个预定义常量，通常用来表示一个空值，用于表示一个空的指针、空的指针数组或者空的结构体指针。

255

2023.09.22

java中null的用法

在Java中，null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量，包括类、接口、数组、字符串等。想了解更多null的相关内容，可以阅读本专题下面的文章。

1153

2024.03.01

if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词，用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章，供大家免费阅读。

847

2023.08.22

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

448

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

606

2023.08.10

windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口，端口号的范围从0到65535，比如用于浏览网页服务的80端口，用于FTP服务的21端口等等。怎么查看windows端口占用情况呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

1541

2023.07.26