PHP应使用proc_open()配合非阻塞读取实时捕获Python进度,Python端需print(..., flush=True),输出PROGRESS:JSON格式,PHP轮询fgets()并设超时,Web环境推荐Redis/文件存进度供前端AJAX轮询。

PHP调用Python脚本并实时捕获stdout进度
PHP本身无法直接“监听”Python进程的内部状态,但可以通过标准输出流(stdout)逐行读取Python脚本打印的进度信息。关键在于Python端主动flush、PHP端用非阻塞或逐行读取方式避免卡死。
- Python脚本必须在print后加
sys.stdout.flush()(或用print(..., flush=True)),否则缓冲区不立即输出,PHP会一直等 - PHP不能用
exec()或shell_exec()—— 它们只返回最终输出,拿不到中间过程 - 推荐用
proc_open()配合stream_set_blocking($stdout, false)实现非阻塞轮询,每100ms检查一次新行 - 避免用
while (!feof($stdout))直接读——若Python还没写完,feof会阻塞,导致PHP挂住
Python端进度输出格式建议(兼容PHP解析)
不要依赖复杂结构,用简单可预测的文本协议最稳。比如固定前缀 + JSON片段,或纯key=value行。
- 推荐格式:
PROGRESS:{"percent":35,"msg":"正在处理第124条"} - 避免空行、ANSI控制符、多行JSON——PHP逐行读时会错位
- 如果Python用 tqdm,务必关掉它默认的回车覆盖(
tqdm(..., leave=True, file=sys.stdout)不够,要设dynamic_ncols=False, bar_format="{l_bar}{bar}| {n_fmt}/{total_fmt} [{elapsed}s]"并手动print+flush) - 错误信息建议走stderr,PHP可单独捕获,避免和进度混在一起
PHP端轮询读取与超时控制
proc_open打开后,stdout是资源句柄,需配合 stream_select() 或定时轮询,否则容易假死或漏数据。
- 每次循环前用
stream_select($read, $write, $except, 0, 100000)(100ms超时)判断是否有新数据可读 - 有数据时用
fgets($stdout)逐行取,别用stream_get_contents()—— 它会吃掉未换行的半截内容 - 必须设最大运行时间(如30秒),用
microtime(true)对比,防止Python卡死导致PHP无限等待 - 进程结束后,用
proc_get_status($proc)['exit_code']判断是否异常退出,而非只看输出内容
Web环境下的高频进度推送难点
浏览器无法持续接收PHP响应流,除非用特定传输机制。单纯echo进度再flush,在现代HTTP/2或Nginx代理下大概率被缓存或截断。
立即学习“PHP免费学习笔记(深入)”;
- 不要指望
ob_flush()+flush()在Web SAPI里稳定工作——CLI下可行,Web下受PHP配置、Web服务器、浏览器共同限制 - 真实高频监控应拆成两步:PHP后台启动Python子进程并记录pid/log路径;前端用AJAX轮询或WebSocket查进度(进度写入Redis或临时文件)
- 若坚持流式响应,必须关闭output_buffering、禁用gzip、设置
header('X-Accel-Buffering: no')(Nginx)、header('Content-Encoding: none'),且仅限简单内网场景 - 最省事又可靠的做法:Python把进度写进
/tmp/progress_{$task_id}.json,PHP接口只读这个文件,前端每500ms GET一次











