0

0

如何在Golang中使用archive/zip_Golang压缩与解压文件实现方法

P粉602998670

P粉602998670

发布时间:2026-02-21 11:08:03

|

726人浏览过

|

来源于php中文网

原创

用 archive/zip 创建 zip 文件需先创建 os.file 并初始化 zip.writer,对每个文件调用 createheader(name 不以 / 开头,可设 method 为 store 或 deflate),再 io.copy 写入内容,最后必须调用 w.close() 写入中央目录;解压时须 filepath.clean() 校验路径防遍历,并检查是否含 "..";fileheader 时间戳和权限需通过 fi.modtime() 和 fi.mode() 显式设置。

如何在golang中使用archive/zip_golang压缩与解压文件实现方法

如何用 archive/zip 创建 ZIP 文件

Go 标准库的 archive/zip 不支持直接“添加文件到已有 ZIP”,必须从头构建。常见错误是试图复用已打开的 *zip.Writer 写入多个独立文件而不调用 Flush() 或忽略 Close() —— 这会导致末尾数据丢失,解压时提示“invalid zip file”或只解出部分文件。

关键步骤:创建 os.File → 用它初始化 zip.NewWriter → 对每个待压缩文件调用 CreateHeader(注意设置 FileHeader.Name 路径不能以 / 开头,否则某些解压工具会拒绝)→ io.Copy 写入内容 → 最后必须调用 w.Close()(它内部会写入中央目录,缺了就不是合法 ZIP)。

示例要点:

  • os.Open("input.txt") 后记得 defer f.Close()
  • fh := &zip.FileHeader{Name: "input.txt", Method: zip.Deflate}Method 设为 zip.Store 可跳过压缩(适合已压缩文件如 .jpg
  • 写入前用 w.CreateHeader(fh),别用 w.Create("name")(它默认设为 Store 且不支持自定义时间戳)
  • 压缩大文件时,zip.Writer 默认缓冲小,可传入带更大 buffer 的 bufio.Writer 提升性能

如何安全地解压 ZIP 文件并防止路径遍历

直接用 z.File[i].Open() + filepath.Join(dst, file.Name) 是高危操作 —— 攻击者构造 ../../../etc/passwd 类型文件名就能写入任意路径。标准做法是:对每个 file.Name 先调用 filepath.Clean(),再检查是否仍以 ".." 开头或包含 ".." 路径段。

立即学习go语言免费学习笔记(深入)”;

实际解压流程:

通塔师AI导航
通塔师AI导航

通塔师AI导航:专业的AI人工智能工具软件导航网站

下载
  • zip.OpenReader("a.zip") 打开,别用 zip.NewReader(它需要自己处理 reader 的 EOF 和 offset)
  • 遍历 z.File 列表,对每个 f:先 cleanName := filepath.Clean(f.Name),再 if strings.HasPrefix(cleanName, "..") || strings.Contains(cleanName, string(filepath.Separator)+".."+string(filepath.Separator)) 就跳过
  • 创建目标路径前,用 os.MkdirAll(filepath.Dir(dstPath), 0755),而非假设父目录存在
  • 写入时用 os.O_CREATE | os.O_WRONLY | os.O_TRUNC,避免 O_APPEND 导致意外追加

zip.FileHeader 中时间戳与权限字段为何常被忽略

zip.FileHeader.ModTime 默认是 Unix 零值(1970-01-01),解压后文件时间全变成这个;FileHeader.Mode() 返回的权限在 Windows 上无效,但在 Linux/macOS 解压时若没显式设置,文件可能丢失可执行位(如脚本变不可运行)。

修复方式:

  • 读取源文件信息:fi, _ := os.Stat("src.txt"),然后 fh.SetModTime(fi.ModTime())
  • 设置权限:fh.SetMode(fi.Mode())(注意:仅对普通文件/目录有效,设备文件等特殊类型会被忽略)
  • 若需兼容老版 Go(SetMode 不可用,则手动赋值:fh.Extra = []byte{0, 0, uint8(fi.Mode() & 0o777), 0}(Unix 扩展字段,非通用)
  • Windows 下无法还原 UID/GID,所以 SetMode 对 owner/group 位无意义,只影响 rwx

为什么解压时遇到 zip: not a valid zip file 却能用其他工具打开

这通常不是 Go 库 bug,而是 ZIP 文件本身有“非标准但兼容”的结构:比如末尾多出签名(如 self-extracting EXE 尾部)、中央目录前有额外数据、或使用了 Go 尚未支持的压缩算法(如 BZIP2LZMA)。archive/zip 严格遵循 ZIP spec,拒绝这些变体。

排查建议:

  • hexdump -C file.zip | head -20 检查开头是否为 50 4b 03 04(PK\003\004)
  • unzip -t file.zip 确认是否真损坏,或只是格式宽松
  • 若确认是 SFX ZIP,先用 dd 截掉头部(如 dd if=sfx.zip of=clean.zip bs=1 skip=XXX)再用 Go 处理
  • 不推荐改源码绕过校验——Go 团队明确表示不会放宽验证,这是设计选择而非缺陷

真正难处理的是跨平台 ZIP 兼容性:macOS 归档实用工具生成的 ZIP 常含 __MACOSX 元数据目录,而 Go 解压时不会自动跳过它,需在遍历时过滤掉以 __ 开头的条目。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
golang如何定义变量
golang如何定义变量

golang定义变量的方法:1、声明变量并赋予初始值“var age int =值”;2、声明变量但不赋初始值“var age int”;3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

207

2024.02.23

golang有哪些数据转换方法
golang有哪些数据转换方法

golang数据转换方法:1、类型转换操作符;2、类型断言;3、字符串和数字之间的转换;4、JSON序列化和反序列化;5、使用标准库进行数据转换;6、使用第三方库进行数据转换;7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

239

2024.02.23

golang常用库有哪些
golang常用库有哪些

golang常用库有:1、标准库;2、字符串处理库;3、网络库;4、加密库;5、压缩库;6、xml和json解析库;7、日期和时间库;8、数据库操作库;9、文件操作库;10、图像处理库。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

348

2024.02.23

golang和python的区别是什么
golang和python的区别是什么

golang和python的区别是:1、golang是一种编译型语言,而python是一种解释型语言;2、golang天生支持并发编程,而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

212

2024.03.05

golang是免费的吗
golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型,并具有垃圾回收功能的开源编程语言,采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

404

2024.05.21

golang结构体相关大全
golang结构体相关大全

本专题整合了golang结构体相关大全,想了解更多内容,请阅读专题下面的文章。

344

2025.06.09

golang相关判断方法
golang相关判断方法

本专题整合了golang相关判断方法,想了解更详细的相关内容,请阅读下面的文章。

198

2025.06.10

golang数组使用方法
golang数组使用方法

本专题整合了golang数组用法,想了解更多的相关内容,请阅读专题下面的文章。

1010

2025.06.17

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

796

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 5.4万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号