0

0

Linux 服务进程假死的检测方式

舞姬之光

舞姬之光

发布时间:2026-02-12 21:42:10

|

311人浏览过

|

来源于php中文网

原创

最直接判断linux服务假死的方式是发送轻量级探测信号或请求看是否响应:先用kill -0检查进程存在性,再通过curl健康端点、查日志、观察资源占用(cpu≈0%、fd/socket卡高位)组合验证。

linux 服务进程假死的检测方式

怎么判断一个 Linux 服务进程是不是假死

假死不是崩溃,也不是退出,而是进程还在 ps 里挂着、systemctl status 显示 active (running),但实际不响应请求、不写日志、不处理信号。最直接的判断方式是:发一个轻量级探测信号或请求,看它是否“有反应”。

推荐组合验证:

  • kill -0 <pid></pid> 检查进程是否存在且可被访问(不真发信号)——仅说明内核还认它活着
  • curl -m 3 http://localhost:8080/health 或类似健康端点(如果服务暴露了)
  • 检查最近日志:journalctl -u myservice --since "2 minutes ago" | tail -5,看有没有新输出
  • 观察资源占用:假死进程常表现为 CPU 接近 0%、RSS 不增长、但文件描述符或 socket 连接数卡在高位

systemd 服务下如何自动发现假死

systemd 本身不主动探测业务逻辑是否存活,只管进程是否在运行。要防假死,得靠 HealthCheck* 类配置或外部探活。

实操建议:

  • 优先启用服务内置健康检查(如 nginx 的 stub_status、redis 的 PING、golang net/http 的 /health),再配合 systemctl show --property=ExecMainPID 获取 PID 后做探测
  • 若服务无健康端点,可用 ss -tlnp | grep :port 看监听 socket 是否仍在 —— 假死后 socket 常被内核回收,但进程没退出
  • 避免依赖 RestartSec=5 直接重启:假死进程可能拒绝 SIGTERM,导致 systemd 最终发 SIGKILL,丢失现场信息
  • 设置 WatchdogSec=30s 并在服务代码中周期性调用 sd_notify("WATCHDOG=1")(需链接 libsystemd),这是 systemd 原生防假死机制

用 shell 脚本做简易假死巡检的坑

很多人写个 while 循环 + curl 就当监控用了,但容易误报或漏报。

启科PHP淘宝客系统
启科PHP淘宝客系统

1、请上传下载到的淘宝客系统安装包并上传到空间根目录中进行解压,解压后将网站文件移动到根目录的位置,然后访问 /install 进行安装。您也可以在本地解压,并以二进制方式将程序上传至您的网站空间。 2、同意启科网络电子商务系统安装协议进入下一步。 3、如果系统检测环境通过,则会提示输入您的数据库服务器地址(一般为本机,即127.0.0.1或者localhost)、数据库账号、数据库密码、数据库名

下载

常见翻车点:

  • curl 默认不校验 HTTP 状态码,curl http://.../health 返回 503 也认为成功 —— 必须加 -f 参数让非 2xx/3xx 触发失败
  • 没设超时:curl 卡住会拖垮整个脚本,必须加 -m 3(秒级)和 --connect-timeout 2
  • ps aux | grep myapp 判断进程存在?危险!grep 自身也会匹配上,应改用 pgrep -f "^/path/to/myapp"pidof myapp
  • 脚本跑在 crontab 里时,PATH 和环境变量和交互式 shell 不同,curlsystemctl 可能找不到 —— 显式写全路径,比如 /usr/bin/curl

strace 跟踪假死进程时的关键观察点

当你已经怀疑某个进程假死,又不想立刻杀掉它,strace 是最贴近真相的工具。

执行 strace -p <pid> -e trace=recvfrom,sendto,accept,read,write,poll,select,epoll_wait -s 64 -T</pid> 后重点关注:

  • 是否长期卡在 epoll_waitpoll 上(说明事件循环没推进)
  • 反复 recvfrom 返回 0(对端关闭连接但程序没处理 EOF)
  • 大量 futex 调用且阻塞时间长(锁竞争或死锁)
  • 系统调用耗时异常高(如 read 耗时 >1s),可能是磁盘 I/O 卡住或网络挂起
  • 注意:不要在生产环境长时间运行 strace,它会让目标进程暂停,影响服务;单次抓 10–20 秒足够定位卡点

假死往往不是单一原因,而是资源泄漏 + 错误处理缺失 + 信号屏蔽叠加的结果。最麻烦的是那种“看起来一切正常”的假死:日志照打、CPU 有波动、连接数缓慢上涨——这时候得看线程栈和 fd 泄漏,别只盯着主进程状态。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
golang如何定义变量
golang如何定义变量

golang定义变量的方法:1、声明变量并赋予初始值“var age int =值”;2、声明变量但不赋初始值“var age int”;3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

206

2024.02.23

golang有哪些数据转换方法
golang有哪些数据转换方法

golang数据转换方法:1、类型转换操作符;2、类型断言;3、字符串和数字之间的转换;4、JSON序列化和反序列化;5、使用标准库进行数据转换;6、使用第三方库进行数据转换;7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

235

2024.02.23

golang常用库有哪些
golang常用库有哪些

golang常用库有:1、标准库;2、字符串处理库;3、网络库;4、加密库;5、压缩库;6、xml和json解析库;7、日期和时间库;8、数据库操作库;9、文件操作库;10、图像处理库。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

346

2024.02.23

golang和python的区别是什么
golang和python的区别是什么

golang和python的区别是:1、golang是一种编译型语言,而python是一种解释型语言;2、golang天生支持并发编程,而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

212

2024.03.05

golang是免费的吗
golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型,并具有垃圾回收功能的开源编程语言,采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

402

2024.05.21

golang结构体相关大全
golang结构体相关大全

本专题整合了golang结构体相关大全,想了解更多内容,请阅读专题下面的文章。

322

2025.06.09

golang相关判断方法
golang相关判断方法

本专题整合了golang相关判断方法,想了解更详细的相关内容,请阅读下面的文章。

197

2025.06.10

golang数组使用方法
golang数组使用方法

本专题整合了golang数组用法,想了解更多的相关内容,请阅读专题下面的文章。

804

2025.06.17

c语言 数据类型
c语言 数据类型

本专题整合了c语言数据类型相关内容,阅读专题下面的文章了解更多详细内容。

4

2026.02.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 9万人学习

Git 教程
Git 教程

共21课时 | 3.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号