0

0

如何在Java中压缩和解压ZIP文件_ZipOutputStream与ZipInputStream实战

P粉602998670

P粉602998670

发布时间:2026-03-17 14:30:31

|

170人浏览过

|

来源于php中文网

原创

ZipOutputStream解压后为空目录的根本原因是未调用closeEntry();目录条目也需调用,且不能依赖close()自动补全。

如何在java中压缩和解压zip文件_zipoutputstream与zipinputstream实战

ZipOutputStream写入文件时为什么解压后是空目录?

根本原因是没调用 closeEntry() —— 很多人只写了 putNextEntry() 就直接写数据,忘了收尾。ZIP格式要求每个条目必须显式关闭,否则解压工具认为该条目没结束,跳过或当成损坏处理。

常见错误现象:unzip 命令报 invalid compressed data to inflate,或者 Windows 解压后看到一堆空文件夹。

  • 必须在写完一个文件内容后立即调用 zos.closeEntry()
  • 如果写的是目录(路径以 / 结尾),putNextEntry() 后不能写任何字节,但依然要调用 closeEntry()
  • 别依赖 zos.close() 自动补全——它不会帮你关未完成的条目
zos.putNextEntry(new ZipEntry("src/"));
// 目录不写内容,但必须 close
zos.closeEntry(); // ← 这行不能省

ZipInputStream读取时 getInputStream() 返回 null 怎么办?

不是流坏了,是当前 ZipEntry 本身不带数据——比如它是目录、或压缩方式为 STORED 但实际长度为 0。Java 的 ZipInputStream 对这类条目会返回 null,而不是抛异常。

使用场景:遍历 ZIP 内容做条件提取(比如只解压 .log 文件),容易在这里卡住。

立即学习Java免费学习笔记(深入)”;

ProcessOn
ProcessOn

免费在线流程图思维导图,专业强大的作图工具,支持多人实时在线协作

下载
  • 先检查 ze.getSize() != 0ze.isDirectory() == false
  • 再判断 ze.getMethod() == ZipEntry.STOREDze.getCrc() == 0,可能也是空条目
  • 永远用 if (in != null) 包一层再读,别直接 in.read(...)
ZipEntry ze = zis.getNextEntry();
if (ze != null && !ze.isDirectory() && ze.getSize() > 0) {
    InputStream in = zis.getInputStream(); // 此时才安全
}

中文文件名乱码(Windows 上最常见)

标准 ZIP 规范不强制指定编码,默认按系统 locale 解释文件名。JDK 原生 ZipInputStream/ZipOutputStream 只支持 UTF-8(从 Java 7 开始可配,但默认关着),而 Windows 默认用 GBK 打包的 ZIP,一读就变问号。

兼容性影响:用 java.util.zip 读老 ZIP 几乎必乱码;用 org.apache.commons.compress 可控,但得手动设编码。

  • 写 ZIP 时,强制用 UTF-8:设置系统属性 -Dsun.zip.encoding=UTF-8(仅 Java 7+ 有效)
  • 更稳的做法:改用 org.apache.commons.compress.archivers.zip.ZipArchiveOutputStream,调用 setEncoding("UTF-8")
  • 读 ZIP 时,如果已知是 GBK 打包的,只能用 ZipArchiveInputStream 并指定 setEncoding("GBK")

大文件压缩内存爆掉或卡死

ZipOutputStream 本身不缓存整个文件,但如果你把大文件一次性读进 byte[] 再写,就等于双倍内存占用。另外,没设缓冲区大小会导致频繁小块 IO,慢到像卡住。

性能影响:100MB 文件用 1KB 缓冲区,IO 次数多 10 万倍;用 8KB 是合理起点。

  • 永远用 byte[] buffer = new byte[8192] 分块读写
  • 别用 Files.readAllBytes() 加载大文件进内存
  • 压缩级别别盲目设 Deflater.BEST_COMPRESSION,对 CPU 和时间消耗陡增,收益却很小
byte[] buf = new byte[8192];
int len;
while ((len = fis.read(buf)) != -1) {
    zos.write(buf, 0, len); // 分块写,不攒整块
}
事情说清了就结束。真正难的不是 API 调用,是那些没报错却让 ZIP 在不同环境里行为分裂的细节——比如空条目、编码隐含假设、缓冲区大小和压缩级别的组合效应。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

255

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

1153

2024.03.01

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

847

2023.08.22

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

448

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

606

2023.08.10

windows查看端口占用情况
windows查看端口占用情况

Windows端口可以认为是计算机与外界通讯交流的出入口。逻辑意义上的端口一般是指TCP/IP协议中的端口,端口号的范围从0到65535,比如用于浏览网页服务的80端口,用于FTP服务的21端口等等。怎么查看windows端口占用情况呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

1541

2023.07.26

查看端口占用情况windows
查看端口占用情况windows

端口占用是指与端口关联的软件占用端口而使得其他应用程序无法使用这些端口,端口占用问题是计算机系统编程领域的一个常见问题,端口占用的根本原因可能是操作系统的一些错误,服务器也可能会出现端口占用问题。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

1172

2023.07.27

windows照片无法显示
windows照片无法显示

当我们尝试打开一张图片时,可能会出现一个错误提示,提示说"Windows照片查看器无法显示此图片,因为计算机上的可用内存不足",本专题为大家提供windows照片无法显示相关的文章,帮助大家解决该问题。

837

2023.08.01

c++ 字符处理
c++ 字符处理

本专题整合了c++字符处理教程、字符串处理函数相关内容,阅读专题下面的文章了解更多详细内容。

0

2026.03.17

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.5万人学习

C# 教程
C# 教程

共94课时 | 11.5万人学习

Java 教程
Java 教程

共578课时 | 83.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号