Python 线程池与进程池的使用取舍

冰川箭仙

发布时间：2026-01-29 12:11:10

733人浏览过

来源于php中文网

原创

CPU密集型任务用ProcessPoolExecutor，I/O密集型用ThreadPoolExecutor；max_workers需按负载类型调优；线程共享内存需锁保护，进程间不共享需Manager；异常在result()才抛出，cancel()对进程基本无效。

python 线程池与进程池的使用取舍

什么时候该用 `ThreadPoolExecutor` 而不是 `ProcessPoolExecutor`

CPU 密集型任务（如数值计算、图像处理）用 ProcessPoolExecutor，I/O 密集型任务（如 HTTP 请求、文件读写）用 ThreadPoolExecutor。Python 的 GIL 会让多线程在 CPU 密集场景下几乎不提速，而多进程能真正并行。

常见误判点：

误把“耗时长”等同于“CPU 密集”——比如压缩一个大文件看似耗时，但实际是 I/O + 少量 CPU，ThreadPoolExecutor 可能更轻量；
在 Web 爬虫中混用同步阻塞库（如 requests）和 ProcessPoolExecutor，反而因进程启动开销和序列化成本变慢；
未考虑对象可序列化性：传给 ProcessPoolExecutor 的函数和参数必须能被 pickle，闭包、lambda、类实例方法常直接报 AttributeError: Can't pickle local object。

`max_workers` 设多少才合理

ThreadPoolExecutor 的 max_workers 默认是 min(32, (os.cpu_count() or 1) + 4)，但这个值对 I/O 任务往往偏小；ProcessPoolExecutor 默认是 os.cpu_count()，对 CPU 密集任务通常够用。

调优建议：

立即学习“Python免费学习笔记（深入）”；

I/O 密集：从 10–100 开始试，观察系统连接数、线程上下文切换频率（pidstat -t）、目标服务限流响应；
CPU 密集：一般不超过 os.cpu_count()，超了反而因调度竞争降低吞吐；
混合负载（如先请求再计算）：优先拆成两层——用线程池做 I/O，结果交给进程池计算，避免单池承担两类压力。

共享状态与资源竞争怎么避坑

线程间共享内存，进程间默认不共享——这是最易出错的分水岭。

Machine Translation

聚合多个来源的AI翻译

下载

典型陷阱：

在线程池里修改全局变量或类属性，可能引发竞态，需加 threading.Lock；
在进程池里试图修改主进程的列表、字典，修改不会回传（每个进程有独立内存副本），要用 multiprocessing.Manager 或显式返回+合并；
数据库连接、文件句柄不能跨进程复用：ProcessPoolExecutor 中每个子进程需自行初始化连接，否则报 sqlite3.ProgrammingError: SQLite objects created in a thread can only be used in that same thread 类错误；
日志写入冲突：多个线程/进程同时写同一文件，需用 logging.handlers.RotatingFileHandler 配合 delay=True，或改用支持并发的日志库（如 concurrent-log-handler）。

异常传播与任务取消的实际表现

submit() 返回的 Future 对象，在调用 result() 时才会抛出子线程/子进程里的异常——这点常被忽略，导致错误静默丢失。

关键差异：

线程池中未捕获异常会终止该线程，但不影响其他任务；
进程池中子进程崩溃（如段错误、SystemExit）会导致 Future.result() 抛出 BrokenProcessPool，整个池不可再用；
Future.cancel() 在线程池中成功率高，在进程池中基本无效——因为 Python 无法强制终止 OS 进程，只能标记“不执行”，若任务已开始，会继续跑完；
想实现超时控制，统一用 future.result(timeout=5)，别依赖 cancel()。

真正难处理的是子进程内发生的 C 扩展崩溃、死循环或阻塞系统调用，这类问题没有银弹，得靠外部监控或封装为带信号超时的子进程（如 subprocess.run(..., timeout=...)）来兜底。

Python 并行控制多台 Android 设备的高效实践指南

Python 中合并具有相同键的元组列表：高效分组教程

Python异步怎么调同步代码_loop.run_in_executor()把阻塞函数放进线程池运行防阻塞

Python怎么读写ini配置_ConfigParser节点Section与键值精确操作

Python怎么找最短路径_Dijkstra算法求单源最短路径图解全过程

相关标签:

python 爬虫 Object 封装 Logging 全局变量循环 Lambda 线程多线程 Thread 闭包并发对象 sqlite 数据库 http

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何优雅扩展 pathlib.Path：函数式辅助优于继承与组合下一篇：systemd-journald "Journal header limits reached or header out-of-date" 的修复

作者最新文章

Windows服务管理中SVCHOST进程占用资源过高定位方法

2026-03-14 11:52

JavaScript变量提升Hoisting现象的发生原理与规避

2026-03-14 11:56

Python版本差异说明_Python2与3核心变化

2026-03-14 12:04

Adobe官网免费下载 Adobe官方试用版获取方法

2026-03-14 12:12

Linux系统通过DU与DF命令监控磁盘空间及文件大小异常

2026-03-14 12:39

Nginx利用非阻塞IO解决慢连接堆积导致的阻塞问题

2026-03-14 13:22

Apache中主备切换过程中请求丢失的预防与补偿方案

2026-03-14 13:24

Linux系统下LVM逻辑卷管理实现磁盘动态扩容的操作流程

2026-03-14 13:53

Linux环境下Ps命令常用组合参数及进程状态识别指南

2026-03-14 14:11

Linux系统定时任务未执行_cron排查

2026-03-14 14:15

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

全局变量怎么定义

本专题整合了全局变量相关内容，阅读专题下面的文章了解更多详细内容。

100

2025.09.18

python 全局变量

本专题整合了python中全局变量定义相关教程，阅读专题下面的文章了解更多详细内容。

126

2025.09.18

lambda表达式

Lambda表达式是一种匿名函数的简洁表示方式，它可以在需要函数作为参数的地方使用，并提供了一种更简洁、更灵活的编码方式，其语法为“lambda 参数列表: 表达式”，参数列表是函数的参数，可以包含一个或多个参数，用逗号分隔，表达式是函数的执行体，用于定义函数的具体操作。本专题为大家提供lambda表达式相关的文章、下载、课程内容，供大家免费下载体验。

215

2023.09.15