Python 压缩算法在不同数据上的实测对比

舞夢輝影

发布时间：2026-02-16 10:50:46

552人浏览过

来源于php中文网

原创

zlib压缩比最高但最慢，lz4最快但压缩比仅zstd的60%～70%，zstd level=3为速度与压缩率最佳平衡点；实际选择需依数据重复度、cpu容忍度及流式需求而定。

python 压缩算法在不同数据上的实测对比

zlib、lz4、zstd 压缩比和速度到底差多少

实测下来，zlib（默认级别）在文本类数据上压缩比最高，但慢；lz4 极快，但压缩比常只有 zstd 的 60%～70%；zstd 在中等压缩级别（level=3）就基本能兼顾速度和压缩率，是多数场景的实用平衡点。

关键不是“哪个最强”，而是你手上的数据是否重复度高、是否允许 CPU 占用、是否需要流式解压。比如日志文件（大量重复字段）用 zstd 级别 10 可能比 zlib 级别 9 还快，而传感器采集的二进制浮点数组，lz4 反而更稳——因为 zlib 和 zstd 都可能因数据熵高而退化成“几乎不压缩+额外开销”。

zlib 对小块数据（
lz4 不支持压缩级别调节（只有 lz4.frame 模式可设 compression_level，但实际影响极小）
zstd 的 level=1 比 lz4 慢一点，但压缩率明显更好；level=3 是它真正的甜点区

Python 里怎么安全地选压缩库和参数

别直接写 import zlib 就开干。先看你的数据特征：是否可预测长度？是否要随机访问？是否跨语言交互？

zlib 兼容性最好（HTTP、gzip、PNG 都用它），但没多线程压缩；lz4 支持多线程压缩（lz4.frame.compress(data, compression_level=0, threads=4)），适合大文件批处理；zstd 的 ZstdCompressor(level=3, threads=0) 默认单线程，设 threads>1 才启用并行分块，但要注意：线程数不是越多越好，超过物理核数反而因调度开销变慢。

立即学习“Python免费学习笔记（深入）”；

搜狐资讯

AI资讯助手，追踪所有你关心的信息

下载

如果数据要被 Go 或 Rust 程序读取，优先选 zstd 或 zlib，lz4 的 Python 绑定（lz4 包）和 C 版本帧格式不完全一致，容易解不出
用 zstd 时，别漏掉 write_content_size=True（否则解压端无法校验长度）
zlib.compress(data, level=-1) 不是“自动选最优”，而是等价于 level=Z_DEFAULT_COMPRESSION（通常是 6），别被文档误导

为什么有时候压缩后反而更大了

这不是 bug，是所有通用压缩算法的固有行为：低熵数据（比如已加密内容、高位随机字节、全零但长度很短）会触发压缩器的“最小输出长度”保护机制，导致加了头部却没省下多少字节。

典型表现：len(zlib.compress(b'\x00' * 10)) == 18，而原始才 10 字节；zstd 更明显，ZstdCompressor().compress(b'\x01') 输出至少 15 字节。

对确定小于 1KB 的数据，建议加个开关：先试算原始大小，if len(data) ，避免负优化
lz4 的 lz4.block.compress() 有 store_size=False 参数可省去长度头，但解压时必须传入原始长度，适用场景有限
别用压缩算法当“通用去重工具”——它不保证相同输入一定产生相同输出（比如 zstd 启用哈希加速后会有微小差异）

实测时最容易被忽略的细节

很多人跑个 timeit 就下结论，但真实瓶颈常不在压缩函数本身：内存拷贝、GIL 争抢、序列化前置成本（比如先把 dict 转 json 再压），都可能掩盖算法差异。

建议用 tracemalloc + time.perf_counter() 分开测三段：序列化耗时、压缩耗时、总内存峰值。你会发现：对一个 10MB 的 dict，json.dumps() 耗时可能是 zstd.compress() 的 2 倍以上。

测试前务必用 gc.disable()，否则 zlib 在大块压缩时可能触发 GC，拉高时间抖动
zstd 的 compress() 接口默认返回 bytes，但如果你后续还要拼接或切片，考虑用 Compressor().compressobj() 流式接口，减少中间内存分配
别信 PyPI 包名带 fast 的轮子——python-lz4 和 zstandard 才是真正调 C 实现的；pure-python-zstd 这类纯 Python 实现，速度差一个数量级