0

0

如何用Python压缩文件?zipfile模块教程

看不見的法師

看不見的法師

发布时间:2025-07-11 12:49:01

|

923人浏览过

|

来源于php中文网

原创

python处理文件压缩主要使用内置的zipfile模块,1. 压缩单个文件可通过zipfile对象写入模式实现;2. 压缩多个文件或目录则遍历路径逐一添加;3. 解压操作支持全部或指定文件提取;4. 查看压缩包内容可使用infolist方法;5. 处理大文件时需注意内存占用和性能优化。该模块功能全面,从基础压缩、解压到高级控制均能胜任,但大规模数据操作时应避免一次性加载过多数据进内存,并推荐使用with语句确保资源释放。

如何用Python压缩文件?zipfile模块教程

Python处理文件压缩这事儿,其实内置的zipfile模块就能搞定,非常直接高效。

如何用Python压缩文件?zipfile模块教程

要用Python来压缩文件,核心就是zipfile模块。它功能挺全面的,从单个文件到整个目录,都能给你安排得明明白白。

如何用Python压缩文件?zipfile模块教程

最基础的,比如你要把一个文件塞进压缩包:

立即学习Python免费学习笔记(深入)”;

import zipfile
import os

def compress_single_file(file_path, output_zip_path):
    # 确保文件存在,不然会报错
    if not os.path.exists(file_path):
        print(f"错误:文件 '{file_path}' 不存在。")
        return

    # 使用with语句,确保文件操作结束后资源被正确释放,这很重要
    try:
        with zipfile.ZipFile(output_zip_path, 'w', zipfile.ZIP_DEFLATED) as zf:
            # arcname参数很重要,决定了文件在压缩包里的名字,
            # 如果不指定,默认是完整路径,可能不是你想要的
            zf.write(file_path, arcname=os.path.basename(file_path))
        print(f"'{file_path}' 已成功压缩到 '{output_zip_path}'。")
    except Exception as e:
        print(f"压缩过程中出现错误:{e}")

# 示例用法:
# # 先创建一个测试文件
# with open('my_document.txt', 'w', encoding='utf-8') as f:
#     f.write("这是一些测试内容,用于演示文件压缩。\n第二行内容。")
# compress_single_file('my_document.txt', 'my_archive.zip')

要是想把好几个文件一起打包,或者干脆把一个文件夹里的所有东西都收进去,那也行:

如何用Python压缩文件?zipfile模块教程
import zipfile
import os

def compress_multiple_files(file_paths, output_zip_path):
    try:
        with zipfile.ZipFile(output_zip_path, 'w', zipfile.ZIP_DEFLATED) as zf:
            for file_path in file_paths:
                if os.path.exists(file_path):
                    zf.write(file_path, arcname=os.path.basename(file_path))
                else:
                    print(f"警告:文件 '{file_path}' 不存在,已跳过。")
        print(f"指定文件已成功压缩到 '{output_zip_path}'。")
    except Exception as e:
        print(f"压缩多个文件时出现错误:{e}")

def compress_directory(dir_path, output_zip_path):
    if not os.path.isdir(dir_path):
        print(f"错误:目录 '{dir_path}' 不存在或不是一个目录。")
        return

    try:
        with zipfile.ZipFile(output_zip_path, 'w', zipfile.ZIP_DEFLATED) as zf:
            # os.walk 是遍历目录的神器,它会递归地找出所有文件和子目录
            for root, _, files in os.walk(dir_path):
                for file in files:
                    full_path = os.path.join(root, file)
                    # 计算文件在zip中的相对路径,这很关键,否则会把整个绝对路径都带进去
                    # 比如,如果dir_path是'my_folder',full_path是'my_folder/sub/file.txt'
                    # 那么arcname就会是'sub/file.txt'
                    arcname = os.path.relpath(full_path, dir_path)
                    zf.write(full_path, arcname=arcname)
        print(f"目录 '{dir_path}' 已成功压缩到 '{output_zip_path}'。")
    except Exception as e:
        print(f"压缩目录时出现错误:{e}")

# 示例用法:
# # 创建一些测试文件和目录
# os.makedirs('test_dir/subdir', exist_ok=True)
# with open('test_dir/file1.txt', 'w', encoding='utf-8') as f: f.write("内容1")
# with open('test_dir/subdir/file2.txt', 'w', encoding='utf-8') as f: f.write("内容2")
#
# compress_multiple_files(['test_dir/file1.txt'], 'my_multi_archive.zip')
# compress_directory('test_dir', 'my_dir_archive.zip')

这里有个小细节,zipfile.ZIP_DEFLATED是指定压缩方式,通常用这个就够了,效果比较好。'w'是写入模式,如果文件存在就覆盖。

除了压缩,zipfile模块还能做什么?

zipfile模块可不只是个压缩工具,它还是个解压缩的好手,甚至能让你窥探压缩包里的内容,检查完整性。这在处理别人给的压缩文件时特别有用,你总不能直接解压到一半发现文件损坏了吧?

比如,你想看看一个zip文件里都有啥:

Getimg.ai
Getimg.ai

getimg.ai是一套神奇的ai工具。生成大规模的原始图像

下载
import zipfile
import os

def list_zip_contents(zip_path):
    if not os.path.exists(zip_path):
        print(f"错误:文件 '{zip_path}' 不存在。")
        return
    if not zipfile.is_zipfile(zip_path):
        print(f"错误:'{zip_path}' 不是一个有效的zip文件。")
        return

    print(f"'{zip_path}' 中的内容:")
    try:
        with zipfile.ZipFile(zip_path, 'r') as zf:
            for info in zf.infolist():
                # info.filename 是文件名
                # info.file_size 是原始大小
                # info.compress_size 是压缩后大小
                print(f"  文件名: {info.filename}, 原始大小: {info.file_size} bytes, 压缩后大小: {info.compress_size} bytes")
    except Exception as e:
        print(f"读取zip文件内容时出现错误:{e}")

# 示例用法:
# list_zip_contents('my_archive.zip') # 假设这个文件存在

解压文件就更直接了,extractall一句话搞定所有,或者extract只解压特定的:

import zipfile
import os

def extract_zip_file(zip_path, extract_to_dir):
    if not os.path.exists(zip_path):
        print(f"错误:文件 '{zip_path}' 不存在。")
        return
    if not zipfile.is_zipfile(zip_path):
        print(f"错误:'{zip_path}' 不是一个有效的zip文件。")
        return

    os.makedirs(extract_to_dir, exist_ok=True) # 确保目标目录存在

    try:
        with zipfile.ZipFile(zip_path, 'r') as zf:
            # 解压所有文件到指定目录
            zf.extractall(extract_to_dir)
        print(f"'{zip_path}' 已成功解压到 '{extract_to_dir}'。")
    except Exception as e:
        print(f"解压过程中出现错误:{e}")

# 示例用法:
# # 假设 'my_dir_archive.zip' 存在
# extract_zip_file('my_dir_archive.zip', 'extracted_content')

有时候,你可能只想解压其中某个文件,比如zf.extract('path/to/file_in_zip.txt', path='destination_folder'),这样就灵活多了。

处理大型文件时,zipfile模块有哪些注意事项?

当你用zipfile处理特别大的文件或者整个目录,比如几个GB的数据集时,有些事儿就得留心了。性能和内存占用是两个大头。

首先是内存。zipfile在处理文件时,尤其是解压时,如果不对内存做限制,可能会一次性读取大量数据到内存,这对于内存有限的系统来说是个灾难。所以,尽量避免一次性处理所有文件,特别是当你用read()或者read(size)ZipFile对象中读取文件内容时,最好分块读取,或者直接使用extract方法让它自己处理。

其次是效率。直接用zipfile.ZipFile(output_zip_path, 'w', zipfile.ZIP_DEFLATED)这种模式,它会先在内存里构建一些结构,然后才写入磁盘。对于超大型的归档操作,你可能需要考虑流式处理,或者更底层的文件操作来避免内存峰值。不过,对于大多数日常使用场景,zipfile已经优化得相当不错了。

还有一个小点,就是append模式。zipfile.ZipFile(path, 'a')可以往已有的zip文件里追加内容。但要注意,这个追加操作其实效率并不高,因为它可能需要重新构建zip文件的目录结构,甚至重写部分内容。所以,如果需要频繁追加,可能得考虑其他方案,或者先全部收集好再一起压缩。

最后,记得用with语句。这不只是个好习惯,更是避免资源泄漏的关键。尤其是在处理大文件时,确保文件句柄

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
append用法
append用法

append是一个常用的命令行工具,用于将一个文件的内容追加到另一个文件的末尾。想了解更多append用法相关内容,可以阅读本专题下面的文章。

344

2023.10.25

python中append的用法
python中append的用法

在Python中,append()是列表对象的一个方法,用于向列表末尾添加一个元素。想了解更多append的更多内容,可以阅读本专题下面的文章。

1073

2023.11.14

python中append的含义
python中append的含义

本专题整合了python中append的相关内容,阅读专题下面的文章了解更多详细内容。

176

2025.09.12

PHP 高并发与性能优化
PHP 高并发与性能优化

本专题聚焦 PHP 在高并发场景下的性能优化与系统调优,内容涵盖 Nginx 与 PHP-FPM 优化、Opcode 缓存、Redis/Memcached 应用、异步任务队列、数据库优化、代码性能分析与瓶颈排查。通过实战案例(如高并发接口优化、缓存系统设计、秒杀活动实现),帮助学习者掌握 构建高性能PHP后端系统的核心能力。

101

2025.10.16

PHP 数据库操作与性能优化
PHP 数据库操作与性能优化

本专题聚焦于PHP在数据库开发中的核心应用,详细讲解PDO与MySQLi的使用方法、预处理语句、事务控制与安全防注入策略。同时深入分析SQL查询优化、索引设计、慢查询排查等性能提升手段。通过实战案例帮助开发者构建高效、安全、可扩展的PHP数据库应用系统。

86

2025.11.13

JavaScript 性能优化与前端调优
JavaScript 性能优化与前端调优

本专题系统讲解 JavaScript 性能优化的核心技术,涵盖页面加载优化、异步编程、内存管理、事件代理、代码分割、懒加载、浏览器缓存机制等。通过多个实际项目示例,帮助开发者掌握 如何通过前端调优提升网站性能,减少加载时间,提高用户体验与页面响应速度。

29

2025.12.30

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

24

2026.01.28

包子漫画在线官方入口大全
包子漫画在线官方入口大全

本合集汇总了包子漫画2026最新官方在线观看入口,涵盖备用域名、正版无广告链接及多端适配地址,助你畅享12700+高清漫画资源。阅读专题下面的文章了解更多详细内容。

7

2026.01.28

ao3中文版官网地址大全
ao3中文版官网地址大全

AO3最新中文版官网入口合集,汇总2026年主站及国内优化镜像链接,支持简体中文界面、无广告阅读与多设备同步。阅读专题下面的文章了解更多详细内容。

28

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.3万人学习

Django 教程
Django 教程

共28课时 | 3.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号