Python操作Excel首选openpyxl(支持.xlsx读写及样式等),xlrd仅限老旧.xls文件且已停更;新项目统一用openpyxl,大文件可结合pandas,避免混用导致格式错误。

Python 中操作 Excel 文件最常用的两个库是 openpyxl 和 xlrd,但它们的适用场景和能力差异明显——选错库容易踩坑。简单说:openpyxl 适合读写 .xlsx 文件(推荐用于新项目);xlrd 3.0+ 版本只支持读取 .xls(旧格式),已不再支持 .xlsx,老版本有安全风险且不兼容 Python 3.12+。
openpyxl:现代 Excel(.xlsx)的主力工具
openpyxl 是目前最主流、功能最全的 Excel 操作库,支持读写、样式、图表、公式、合并单元格等,专为 Office Open XML 格式(即 .xlsx/.xlsm/.xltx)设计。
- 安装:pip install openpyxl
-
读取 Excel:用
load_workbook()打开文件,通过active或sheetnames获取工作表,再用行列索引或坐标(如['A1'])取值 -
写入 Excel:新建
Workbook()或加载后修改单元格值(ws['B2'] = 'Hello'),最后调用wb.save('output.xlsx') -
注意:openpyxl 不解析公式结果,而是读取公式字符串;如需计算结果,需用
data_only=True参数加载(但会丢失公式本身)
xlrd:仅限老旧 .xls 文件,新版慎用
xlrd 原本支持 .xls 和 .xlsx,但自 2020 年起,xlrd 2.0.0 开始彻底移除 .xlsx 支持,仅保留对 Excel 97-2003 格式(.xls)的读取能力。当前最新版(2.0.1+)不支持 Python 3.12,也不再维护。
- 适用场景:必须处理遗留的 .xls 文件,且无法转成 .xlsx
- 安装:pip install xlrd==2.0.1(避免自动升级到不兼容版本)
-
基本用法:用
xlrd.open_workbook()加载,sheet_by_index()或sheet_by_name()获取表,cell_value(row, col)读数据 - 警告:不要用 xlrd 处理未知来源的 .xls 文件——它曾存在远程代码执行漏洞(CVE-2020-15939),老版本风险高
替代方案建议:按需求选更稳妥的库
单靠 xlrd 或 openpyxl 并不能覆盖所有场景。实际项目中推荐组合使用或切换:
立即学习“Python免费学习笔记(深入)”;
- 统一转为 .xlsx:用
xlrd(仅限 .xls)或在线/桌面工具批量转换,后续全部用openpyxl - 需要高性能读取大文件:考虑
pandas.read_excel()(底层自动调用 openpyxl 或 xlrd,根据后缀智能选择) - 纯读取 + 兼容性优先:用
pyxlsb(.xlsb)、odfpy(.ods),或calamine(Rust 编写,速度快,支持 .xlsx/.xlsb) - 写入简单表格、不依赖 Excel 特性:直接用
pandas.to_excel(),简洁可靠
常见问题快速对照
遇到报错别慌,先看后缀和库是否匹配:










