0

0

strace -p 挂上后卡在 epoll_wait 的网络 IO 等待分析

舞姬之光

舞姬之光

发布时间:2026-01-31 11:54:09

|

105人浏览过

|

来源于php中文网

原创

进程挂起在epoll_wait是正常现象,表示线程正阻塞等待网络事件;需结合-T/-tt参数看耗时、检查socket状态及信号干扰,排除真卡死。

strace -p 挂上后卡在 epoll_wait 的网络 io 等待分析

strace -p 卡在 epoll_wait 是正常现象

进程挂起在 epoll_wait 本身不表示异常,而是事件驱动模型的典型行为:线程正阻塞等待网络事件(如新连接、数据到达、对端关闭)。strace -p 只是如实反映当前系统调用状态,并非 strace 导致卡住。

常见误判场景包括:误以为进程“假死”,或怀疑 strace 干扰了业务逻辑。实际上,只要进程没被信号中断或崩溃,它就在合法等待中。

  • 确认是否真卡死:用 kill -0 $PID 检查进程是否存活;用 ps -o pid,ppid,stat,time,comm -p $PIDSTAT 字段是否为 S(可中断睡眠)而非 D(不可中断,需警惕)
  • 若进程长期无响应且 epoll_wait 不返回,优先排查上游连接方是否断连未通知、TCP keepalive 是否启用、或对端静默丢包
  • strace -p 本身会轻微增加调度开销,但不会阻止 epoll_wait 被唤醒 —— 唤醒由内核网络子系统触发,与 trace 工具无关

用 -T 和 -tt 看 epoll_wait 的实际等待时长

默认 strace -p 不显示系统调用耗时,无法判断是毫秒级常规等待,还是已卡住数分钟。加时间戳参数才能定位真实延迟。

  • strace -p $PID -T:在每行末尾显示该次系统调用实际耗时(单位秒),例如 epoll_wait(5, [], 128, -1) = 0 表示只等了 12 微秒
  • strace -p $PID -tt:打印微秒级绝对时间戳,方便比对前后调用间隔,识别是否某次 epoll_wait 返回后长时间没下一次调用(说明业务逻辑卡在用户态)
  • 避免只看 -t(秒级时间戳),精度不够,无法区分“正常轮询”和“异常挂起”

结合 ss 和 /proc/$PID/fd 确认 epoll 实例关联的 socket 状态

epoll_wait 在等什么?不能只看系统调用名,得知道它监听的 fd 对应哪些 socket,以及这些 socket 当前是否健康。

uBrand
uBrand

一站式AI品牌创建平台,在线品牌设计,AI品牌策划,智能品牌营销;uBrand帮助创业者轻松打造个性品牌!

下载
  • 先用 ls -l /proc/$PID/fd/ | grep epoll 找出 epoll fd(通常是数字,如 3
  • 再用 cat /proc/$PID/fdinfo/3 查看该 epoll 实例注册了哪些被监听 fd(字段 tfds 列出所有注册项)
  • 对每个被监听 fd(比如 7),执行 ss -tanfp "fd==7"ls -l /proc/$PID/fd/7 看它指向的 socket 类型、对端地址、TCP 状态(ESTAB / CLOSE_WAIT / TIME_WAIT
  • 特别注意 CLOSE_WAIT 过多:说明对端已关闭,但本端应用没调用 close()read() 到 EOF,导致 socket 一直留在 epoll 中等待读事件,而 epoll_wait 会持续返回就绪 —— 此时你会看到高频 epoll_wait 返回 + read() 返回 0,不是卡住,是业务没处理完关闭流程

epoll_wait 返回 -1 EINTR 时容易被忽略的信号干扰

如果 strace -p 输出中频繁出现 epoll_wait(... ) = -1 EINTR (Interrupted system call),说明有信号反复打断等待。这不是卡住,但可能掩盖真正问题。

  • 常见诱因:strace 自身发送 SIGSTOP/SIGCONT(尤其在多线程进程上)、定时器信号(ITIMER_REAL)、或外部 kill -USR1 类调试信号
  • EINTR 下,epoll_wait 会立即返回,不等待事件,导致 CPU 空转(busy loop),表现像“卡在日志里刷屏”,实则是高频重试
  • 检查信号屏蔽:用 cat /proc/$PID/status | grep SigSigBlk(阻塞信号集)和 SigCgt(捕获信号集),确认是否有未预期信号被进程注册处理
  • 临时规避:用 strace -p $PID -e trace=epoll_wait,read,write 减少 trace 干扰;长期方案是业务代码对 EINTR 做正确重试或屏蔽无关信号

真正难排查的是 epoll_wait 长期不返回且无超时(timeout = -1),同时 socket 状态全为 ESTAB、无错误日志、CPU 使用率极低 —— 这时候得怀疑内核协议异常、网卡 offload 故障,或者进程被 cgroup 冻结、OOM killer 标记但尚未 kill。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

398

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

575

2023.08.10

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

525

2023.08.10

Python 多线程与异步编程实战
Python 多线程与异步编程实战

本专题系统讲解 Python 多线程与异步编程的核心概念与实战技巧,包括 threading 模块基础、线程同步机制、GIL 原理、asyncio 异步任务管理、协程与事件循环、任务调度与异常处理。通过实战示例,帮助学习者掌握 如何构建高性能、多任务并发的 Python 应用。

187

2025.12.24

java多线程相关教程合集
java多线程相关教程合集

本专题整合了java多线程相关教程,阅读专题下面的文章了解更多详细内容。

19

2026.01.21

C++多线程相关合集
C++多线程相关合集

本专题整合了C++多线程相关教程,阅读专题下面的的文章了解更多详细内容。

17

2026.01.21

2026赚钱平台入口大全
2026赚钱平台入口大全

2026年最新赚钱平台入口汇总,涵盖任务众包、内容创作、电商运营、技能变现等多类正规渠道,助你轻松开启副业增收之路。阅读专题下面的文章了解更多详细内容。

17

2026.01.31

高干文在线阅读网站大全
高干文在线阅读网站大全

汇集热门1v1高干文免费阅读资源,涵盖都市言情、京味大院、军旅高干等经典题材,情节紧凑、人物鲜明。阅读专题下面的文章了解更多详细内容。

7

2026.01.31

无需付费的漫画app大全
无需付费的漫画app大全

想找真正免费又无套路的漫画App?本合集精选多款永久免费、资源丰富、无广告干扰的优质漫画应用,涵盖国漫、日漫、韩漫及经典老番,满足各类阅读需求。阅读专题下面的文章了解更多详细内容。

10

2026.01.31

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 4.4万人学习

Pandas 教程
Pandas 教程

共15课时 | 1.0万人学习

ASP 教程
ASP 教程

共34课时 | 4.3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号