Python网站监控核心是定期请求、状态判断、异常记录与可视化反馈,需组合检查HTTP状态码(200–299)、响应时间(如≤3s)及关键内容,用logging写结构化日志,结合schedule或cron调度,辅以收敛告警。

用 Python 做网站可用性监控,核心是“定期请求 + 判断状态 + 异常记录 + 可视化反馈”,不追求复杂,重在稳定、可维护、易排查。
基础检测逻辑:HTTP 状态码 + 响应时间 + 关键内容校验
只看 status_code == 200 不够可靠,比如页面返回 200 但实际是错误页或空白页。建议组合判断:
- 检查 HTTP 状态码是否在 [200, 299] 范围内
- 设置超时(如 timeout=10),避免单次卡死影响整体轮询节奏
- 可选:用 response.text 或 BeautifulSoup 检查页面是否包含预期关键词(如“欢迎登录”、“服务正常”)
- 记录响应耗时(response.elapsed.total_seconds()),超过阈值(如 3s)也记为异常
异常记录方案:本地日志 + 结构化存储
别只 print 或写纯文本,方便后续分析和告警:
- 用 logging 模块写入带时间戳、URL、状态码、耗时、错误信息的结构化日志(推荐 JSON 格式)
- 异常发生时,把完整 response.headers 和截断的 response.text(前500字符)一并记下,便于复现问题
- 可额外存一份 CSV 或 SQLite,字段包括:timestamp、url、status、elapsed、is_ok、error_msg,方便 Excel 打开或简单查询
调度与稳定性:用 schedule 或系统 cron,避免长时运行内存泄漏
不推荐用 while True + sleep 做长期守护,容易累积异常、难重启:
立即学习“Python免费学习笔记(深入)”;
- 轻量场景:用 schedule 库 + 后台进程(nohup python monitor.py &)即可,每 30 秒/5 分钟跑一次
- 生产环境:直接交给系统 cron(Linux/macOS)或 Task Scheduler(Windows),脚本每次独立启动,天然隔离
- 每次运行前加简单锁文件或 PID 检查,防重复执行(尤其 cron 误配时)
轻量告警:邮件 / 微信 / 钉钉 Webhook,触发条件要收敛
告警不是越多越好,避免疲劳和误报:
- 只对“连续 N 次失败”或“首次失败且非 404”发通知(比如连续 2 次 500 或连接超时)
- 微信/钉钉用 requests.post 发 Webhook,消息体含 URL、失败时间、状态码、最近一次耗时
- 邮件用 smtplib,主题标红【WARN】,正文保持简洁,附日志路径或关键错误片段
- 成功恢复时,补发一条“已恢复”通知,形成闭环
基本上就这些。脚本控制在 150 行以内,配置抽成 config.py 或 .env,下次换域名、调间隔、加新站,改两行就行。










