0

0

Python 程序运行状态的可观测性设计

冷炫風刃

冷炫風刃

发布时间:2026-01-30 20:33:12

|

890人浏览过

|

来源于php中文网

原创

Python进程需主动暴露运行状态:用psutil采集CPU/内存/线程数,结合threading.active_count()和gc.get_stats()补充应用层指标;HTTP接口应分三级(/health、/ready、/metrics),避免耗时操作;日志与监控需统一OpenTelemetry或通过threading.local()关联;异步任务须用自定义registry+异常安全清理防内存泄漏。

python 程序运行状态的可观测性设计

怎么让 Python 进程主动暴露运行状态

Python 默认不对外暴露运行时指标,得靠自己加钩子。核心思路是:用 psutil 抓进程级基础数据(CPU、内存、线程数),再配合 threading.active_count()gc.get_stats()(3.12+)或 len(gc.get_objects()) 补充应用层状态。别依赖 sys.getsizeof() 查对象大小——它不递归,结果严重偏低。

常见错误是只采集启动时的 PID,后续 fork 或 reload 后失效。正确做法是在采集逻辑里每次调用 os.getpid() 动态获取,尤其在多进程(如 Gunicorn worker)场景下。

HTTP 接口暴露健康与指标是否足够可靠

单纯加个 /health 返回 {"status": "ok"} 没用,它不反映真实负载。生产环境至少要分三级:

  • /health:只检查自身 socket 可连、主线程存活(用 threading.main_thread().is_alive()
  • /ready:额外验证下游依赖(DB 连接池可用、Redis ping 通),超时严格控制在 1s 内
  • /metrics:输出 Prometheus 格式,含 python_gc_collected_totalprocess_cpu_seconds_total 等标准指标

注意:不要在 /metrics 里执行耗时操作(如遍历所有 request 对象),否则会拖慢抓取,导致监控系统误判。

立即学习Python免费学习笔记(深入)”;

日志里埋点为什么总对不上监控曲线

根本原因是日志打点和指标采集时间窗口不一致。比如用 logging.info("req_time=%.3f", time.time() - start) 记耗时,但 Prometheus 的 http_request_duration_seconds 是直方图聚合,两者统计口径不同。

Loomi
Loomi

全球首个AI社媒内容多智能体系统

下载

解决办法只有两个:

  • 统一用 OpenTelemetry SDK 上报 trace + metric,让 http.server.request.duration 和日志里的 trace_id 关联
  • 如果不用 OTel,至少把关键耗时存进 threading.local(),在日志 handler 里读取并附加到 log record,再用 Loki 做日志指标联动

别手动在日志里拼 "cpu: {}/mem: {}".format(...) —— 这会让日志解析器崩溃,也污染结构化字段。

异步任务(Celery/AIOHTTP)的状态怎么不丢不重

Celery 的 task-senttask-received 事件默认不持久化,Broker 重启就丢失。必须配 worker_send_task_events = True 并用 celery events 实时消费,或者直接对接 celery.app.control.inspect().active() 定期拉取。

AIOHTTP 场景更麻烦:每个 request handler 是独立 task,但 asyncio.all_tasks() 会混入系统 task(如 DNS resolver)。安全做法是用 asyncio.current_task().get_name() 打标记,或在 middleware 里把 task 加入自定义 registry:

active_requests = set()
# middleware 中
task = asyncio.current_task()
active_requests.add(task)
try:
    await handler(request)
finally:
    active_requests.discard(task)

这里容易忽略的是 task cancel 异常——如果没在 finally 清理,集合会持续膨胀,最终吃光内存。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

889

2023.07.31

python中的format是什么意思
python中的format是什么意思

python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

466

2024.06.27

硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

2008

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

681

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2440

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

49

2026.01.19

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

786

2023.08.10

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

786

2023.08.10

chatgpt使用指南
chatgpt使用指南

本专题整合了chatgpt使用教程、新手使用说明等等相关内容,阅读专题下面的文章了解更多详细内容。

0

2026.03.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 22.5万人学习

Django 教程
Django 教程

共28课时 | 5.1万人学习

SciPy 教程
SciPy 教程

共10课时 | 2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号