Python 批处理任务的可重入设计

舞姬之光

发布时间：2026-02-15 17:51:10

743人浏览过

来源于php中文网

原创

os.listdir()不可用于可重入批处理，因其返回无序且无时间戳，易致任务重复或遗漏；应改用os.scandir()获取direntry对象，直接读取mtime并加1秒缓冲筛选新文件。

python 批处理任务的可重入设计

为什么 `os.listdir()` 不能直接用于可重入批处理

因为它的返回结果无序且不带时间戳，同一目录多次执行可能拿到不同顺序的文件，导致任务重复或跳过。更关键的是，它无法区分“刚写完的文件”和“上一轮残留的未处理文件”。

实操建议：

立即学习“Python免费学习笔记（深入）”；

改用 os.scandir()，它返回 DirEntry 对象，可直接访问 entry.stat().st_mtime 和 entry.name，避免二次 os.stat() 调用
按修改时间升序遍历，并加 1 秒缓冲（例如只处理 mtime 的文件），防写入未落盘
跳过以 .tmp、~ 或 .swp 结尾的文件名，这些往往是编辑器或程序未完成写入的中间态

`concurrent.futures.ThreadPoolExecutor` 在批处理中如何避免状态污染

多线程共享内存，如果任务函数里用了模块级变量、全局字典或类静态属性，不同批次之间会互相干扰——比如上一批没清空的 processed_files 列表，下一批直接复用，就变成“假重入”。

实操建议：

立即学习“Python免费学习笔记（深入）”；

所有中间状态必须绑定到单次任务的局部作用域，例如把文件路径传进函数，由函数内部打开、处理、关闭，不依赖外部缓存
禁用 functools.lru_cache 或自定义缓存装饰器，除非明确设了 maxsize=0 或按批次 ID 隔离 key
若必须共享资源（如数据库连接池），确保使用线程安全的封装，例如 threading.local() 实例做连接句柄隔离

如何用 `sqlite3` 做轻量级可重入锁而非文件锁

文件锁（flock）在 NFS 或容器挂载卷上不可靠；而用临时文件标记“正在处理”又容易因崩溃残留，导致后续批次永远卡住。

迅易年度企业管理系统开源完整版

系统功能强大、操作便捷并具有高度延续开发的内容与知识管理系统，并可集合系统强大的新闻、产品、下载、人才、留言、搜索引擎优化、等功能模块，为企业部门提供一个简单、易用、开放、可扩展的企业信息门户平台或电子商务运行平台。开发人员为脆弱页面专门设计了防刷新系统，自动阻止恶意访问和攻击；安全检查应用于每一处代码中，每个提交到系统查询语句中的变量都经过过滤，可自动屏蔽恶意攻击代码，从而全面防止SQL注入攻击

下载

实操建议：

立即学习“Python免费学习笔记（深入）”；

建一张 task_lock 表，字段为 job_id TEXT PRIMARY KEY, acquired_at REAL, pid INTEGER
获取锁用 INSERT OR IGNORE INTO task_lock VALUES (?, ?, ?)，成功即获得锁；失败说明已有同 job_id 在跑
每次任务结束前执行 DELETE FROM task_lock WHERE job_id = ? AND pid = ?，并用 PRAGMA journal_mode = WAL 提升并发安全

重试逻辑里最常被忽略的幂等性破环点

不是所有“重试”都真正可重入。比如调用一次 shutil.move(src, dst) 成功后，第二次再调这个语句会报 FileNotFoundError 或静默覆盖，取决于 dst 是否已存在。

实操建议：

立即学习“Python免费学习笔记（深入）”；

移动前先检查 os.path.exists(dst)，存在则跳过；或者统一用 shutil.copy2() + os.remove() 分两步，失败时也容易回滚
对外部服务的调用（如 HTTP 请求）必须带唯一 idempotency-key 请求头，并在服务端实现幂等判断
日志记录要包含原始输入哈希（如 hashlib.md5(json.dumps(input_data).encode()).hexdigest()），方便排查是否真重复执行

可重入真正的难点不在“怎么启动”，而在“怎么确认上一次确实结束了”。很多问题出在状态边界模糊——比如认为文件移动完成就算任务结束，却忽略了重命名系统调用也可能被信号中断。得把“完成”的定义落到原子操作上，而不是人眼可见的结果。

Python chain 在数据拼接中的正确使用方式

Python hatch 的环境管理与脚本定义

Python 文件与锁的统一管理方式

Python yarl.URL 的不可变性优势

Python SIGTERM 与 SIGKILL 的处理差异

相关标签:

python json Integer 封装线程多线程 delete 并发对象作用域数据库 http

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Python 滑动窗口限流的 python 实现下一篇：暂无

作者最新文章

发票抽奖要满足什么条件才能抽发票抽奖是真的吗怎么参与

2026-02-13 11:09

发票抽奖没有发票代码怎么办发票抽奖怎么参加

2026-02-13 11:43

发票抽奖在哪查询发票抽奖查询官网入口网页

2026-02-13 11:45

两新补贴政策怎么领取？两新补贴攻略指南【教程】

2026-02-13 11:46

住房个税退税不同城可以退吗换购住房个税退税全指南(2026最新版

2026-02-13 11:49

IQOO手机各个型号参数一览表 IQOO全系列型号参数汇总

2026-02-13 12:04

崩坏:星穹铁道4.0最新兑换码星铁4.0免费兑换码活动入口

2026-02-13 12:05

终末地影拓丰碑攻略平民影拓丰碑全满星教程

2026-02-13 12:13

崩坏:星穹铁道4.0卡池抽取建议星铁4.0角色强度榜

2026-02-13 12:13

《明日方舟终末地》影拓丰碑第一期配队打法攻略【平民】

2026-02-13 12:17

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章，帮助大家解决问题。

441

2023.08.07

json是什么

JSON是一种轻量级的数据交换格式，具有简洁、易读、跨平台和语言的特点，JSON数据是通过键值对的方式进行组织，其中键是字符串，值可以是字符串、数值、布尔值、数组、对象或者null，在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容，供大家免费下载体验。

544

2023.08.23