python自动化批量处理文件的核心是用os、glob、pathlib定位文件,再执行重命名、读写、格式转换等操作;推荐使用pathlib遍历筛选,结合try/except提升健壮性。

Python自动化脚本批量处理文件,核心在于用标准库(如 os、glob、pathlib)高效定位文件,再结合具体任务逻辑(重命名、读写、格式转换等)统一执行,避免重复手工操作。
用 pathlib 批量遍历和筛选文件
pathlib 是 Python 3.4+ 推荐的路径操作方式,代码更直观、跨平台性好。比如要处理当前目录下所有 `.txt` 文件:
- 用 Path(".").glob("*.txt") 获取匹配路径对象列表
- 用 Path("data").rglob("*.log") 递归搜索子目录
- 配合 is_file() 过滤掉目录,避免报错
按规则批量重命名或移动文件
重命名常用于整理下载文件、统一前缀、替换空格等。关键点是生成新路径后调用 rename():
中国最实用的办公自动化系统,全面提升单位的工作效率和质量,整合企业资源,规范办公流程,加快信息流通,提高办公效率,降低办公成本,通过提高执行力来完善管理,从而提升企业竞争力 含公告通知、文件传送、电子通讯薄、日程安排、工作日记、工作计划、个人(公共)文件柜、网上申请和审批、电子邮件、手机短信、个人考勤、知识管理、人事管理、车辆管理、会议管理、印信管理、网上填报、规章制度、论坛、网络会议、语音聊天、
- 提取原文件名用 stem(不含后缀),后缀用 suffix
- 新名字建议用 with_name() 或拼接 parent / "new_name" + suffix
- 移动文件本质也是 rename(),目标路径写成另一个目录即可
批量读写内容:文本清洗与格式转换
例如把多个 CSV 中的中文逗号替换成英文逗号,或把日志里时间戳统一转为 ISO 格式:
立即学习“Python免费学习笔记(深入)”;
- 逐个打开文件时用 encoding="utf-8" 避免乱码,加 errors="ignore" 容错
- 修改后用 write_text() 直接覆盖,或 write_bytes() 处理二进制
- 涉及结构化数据(CSV/JSON)优先用 pandas 或 csv/json 模块,别用字符串替换硬刚
加简单控制逻辑提升健壮性
真实场景中文件可能缺失、权限不足或编码异常,脚本不能一错就停:
- 用 try/except 包裹单个文件处理块,出错只跳过该文件并打印提示
- 用 if file.exists() and file.is_file(): 提前校验
- 处理前用 print(f"共找到 {len(files)} 个待处理文件") 给用户明确反馈









