0

0

Java中如何操作ZipInputStream进行解压_Java ZIP流处理机制讲解

P粉602998670

P粉602998670

发布时间:2025-12-15 11:19:04

|

903人浏览过

|

来源于php中文网

原创

Java中ZipInputStream只能顺序读取ZIP条目,需用getNextEntry()循环遍历,每次调用后流自动定位到条目数据起始;解压前须标准化路径防../攻击,创建父目录并安全写入;因不读中央目录,无法获取文件列表或准确大小,需用ZipFile替代。

java中如何操作zipinputstream进行解压_java zip流处理机制讲解

Java中用ZipInputStream解压,核心是逐个读取ZIP条目(ZipEntry),再按需提取内容——它不支持随机访问,只能顺序读取,且无法直接获取文件列表或总大小。

如何正确遍历并解压ZIP条目

必须用getNextEntry()循环获取每个条目,每次调用后流位置自动跳转到该条目的数据起始处。注意:不能跳过条目或反复读取同一个条目,否则流状态会错乱。

  • 调用getNextEntry()前确保上一个条目已完全读完(比如用read()读到-1,或用skip()跳过剩余字节
  • 每个ZipEntry代表一个文件或目录,通过isDirectory()区分;路径名用getName()获取,含原始层级结构
  • 读取完当前条目数据后,必须再调用一次getNextEntry()才能进入下一个——返回null表示结束

解压时如何安全创建目录和写入文件

ZIP中的路径可能是data/config.jsonimages/logo.png,也可能含../等危险路径。实际解压前应做路径校验:

  • Paths.get(entry.getName()).normalize()标准化路径,检查是否以..开头或包含..片段
  • 创建父目录:用Files.createDirectories(file.getParent()),自动处理多级目录
  • 写入文件时建议用Files.write(path, bytes, StandardOpenOption.CREATE),避免覆盖系统关键文件

为什么不能直接用ZipInputStream获取文件列表或大小

ZipInputStream是“流式”设计,只解析本地文件头(Local File Header),不读取中央目录(Central Directory)。而文件总数、索引、压缩前大小等元信息都存在中央目录里——它在ZIP末尾,流还没读到那儿。

DALL·E 2
DALL·E 2

OpenAI基于GPT-3模型开发的AI绘图生成工具,可以根据自然语言的描述创建逼真的图像和艺术。

下载

立即学习Java免费学习笔记(深入)”;

  • 想提前知道条目数或某文件是否存在?改用ZipFile(基于随机访问,可直接entries()getEntry(name)
  • ZipInputStreamgetSize()getCompressedSize()可能返回-1,因为本地头里不一定存这些值
  • 若需边解压边统计,只能自己累加读取的字节数,不能依赖Entry字段

常见坑与规避方式

容易忽略编码、缓冲、资源释放等细节,导致中文乱码、性能差或文件句柄泄漏:

  • ZIP文件名编码默认是IBM437,但国内常用GBK/UTF-8。可用ZipInputStream子类重写createZipEntry(String),或改用Apache Commons Compress(支持指定编码)
  • 务必用try-with-resources包裹ZipInputStream和输出FileOutputStream,防止流未关闭
  • 别用单字节read(),至少用8KB缓冲区(byte[] buf = new byte[8192]),大幅提升IO效率

基本上就这些。用ZipInputStream适合处理大ZIP或内存受限场景,但要接受“只能顺序读+无预览”的限制。真需要灵活操作,优先考虑ZipFile

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

419

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

535

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

311

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

77

2025.09.10

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

443

2023.08.02

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

236

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

458

2024.03.01

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

236

2023.09.22

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

158

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 3万人学习

C# 教程
C# 教程

共94课时 | 7.8万人学习

Java 教程
Java 教程

共578课时 | 52.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号