Linux 服务器宕机后的排查步骤

舞夢輝影

发布时间：2026-02-28 10:48:11

509人浏览过

来源于php中文网

原创

服务器宕机后应先确认是否真宕机，再依次检查系统日志、资源耗尽情况及服务配置变更，最后建立监控预警机制。

linux 服务器宕机后的排查步骤

服务器宕机后，先别急着重启，关键是要快速定位原因，避免重复发生。以下步骤按优先级和实操性整理，覆盖常见硬件、系统、服务层面问题。

一、确认是否真宕机，还是仅服务不可达

很多“宕机”其实是网络或服务中断，而非系统崩溃：

用另一台机器 ping 服务器 IP，看是否响应；不响应再尝试 telnet 或 nc 检查 SSH 端口（如 nc -zv 192.168.1.100 22）
检查路由器、交换机、防火墙策略，确认没误封 IP 或关闭端口
如果是云服务器，登录控制台查看实例状态（如 AWS EC2 的“Instance Status Checks”，阿里云的“系统/实例健康状态”）
物理服务器需现场确认：电源指示灯、硬盘灯是否闪烁，是否有异常蜂鸣声

二、检查系统日志（需能登录或挂载磁盘）

若可 SSH 登录或通过救援模式挂载根分区，日志是核心线索：

清爽型淘客天下模板

由淘返利提供的清爽型淘客天下模板是经过多重杀毒软件检查，是一款开放的ASP源程序，为淘宝客免费提供服务。后台地址：你的网址/admin/index.asp 浏览后台账号：admin密码：admin路径：adminn 网站后台具有的功能1.淘宝商品推广，店铺推广及管理功能。2.超强的分类管理，商品分类随心所欲自由排序、修改分类时同步更新所属商品。3.内嵌仿Word在线编辑器，可在商品介绍、新

下载

/var/log/messages（CentOS/RHEL）或 /var/log/syslog（Ubuntu/Debian）：搜索关键词 panic、oom-killer、hardware error、segfault
dmesg -T | tail -100：查看内核环缓冲区，重点关注内存不足（OOM）、磁盘 I/O 错误、驱动崩溃、CPU 温度告警
journalctl -b -1：如果上次启动失败，查上一次 boot 的完整日志（适用于 systemd 系统）
特别注意时间戳——宕机前 2~5 分钟的日志往往包含直接诱因

三、排查资源耗尽类问题

内存、CPU、磁盘满是高频原因，尤其在无监控场景下易被忽略：

内存：执行 free -h 和 cat /proc/meminfo | grep -E "MemAvailable|SwapFree"；若 MemAvailable 接近 0 且 OOM Killer 被触发，dmesg 通常会打印被 kill 的进程
CPU：用 top 或 htop 查看负载（load average > CPU 核数 × 3 需警惕），注意 %si（软中断）过高可能指向网卡或存储驱动异常
磁盘：运行 df -h 和 df -i（inode 耗尽也会导致服务异常）；lsblk && smartctl -a /dev/sda 检查磁盘健康（需安装 smartmontools）

四、检查关键服务与配置变更

人为操作或自动更新常引发连锁故障：

确认最近是否执行过 yum update、apt upgrade 或内核升级——新内核启动失败会导致黑屏式宕机
检查定时任务：crontab -l 和 /etc/cron.d/ 下脚本，是否有清日志、rsync 同步等高 IO 操作
验证关键服务状态：systemctl list-units --state=failed，重点看 sshd、network、systemd-journald 是否异常退出
检查 /etc/fstab：新增挂载项配置错误（如 NFS 不可达却设置 _netdev 缺失）可能导致开机卡住

不复杂但容易忽略——每次处理完，建议补上基础监控（如 Prometheus + Node Exporter）和日志轮转策略，把“事后救火”变成“事前预警”。

Linux 服务器安全加固基础方案

Linux 禁止 root 远程登录配置

Linux 进程异常退出问题排查

Linux K3s 的轻量 Kubernetes 与嵌入式 etcd 生产适用性

Linux 定时任务 crontab 配置方法

相关标签:

linux Error var linux ubuntu centos ssh debian prometheus 云服务器

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Linux 内存持续增长问题定位下一篇：Linux 启动服务与停止服务方法

作者最新文章

bmi在线计算器快速使用_BMI指数在线计算工具免费入口地址

2026-02-27 00:23

苹果黑屏怎么回事？iPhone 黑屏常见原因全面解析

2026-02-27 00:59

发票查询系统能查到上一年的吗

2026-02-27 01:55

美的空调不制冷是怎么回事美的空调制冷故障解析

2026-02-27 06:09

oppo手机报价大全最新 OPPO最新机型价格参考

2026-02-27 08:07

SQL 参数传递机制分析与应用实践

2026-02-27 09:02

Linux rook-ceph 的 cephfs / rbd / object 存储多协议并存配置

2026-02-27 09:33

Linux 运维日常巡检脚本示例

2026-02-27 09:51

mcjs网页版无需下载安装指南_MCJS网页版免费无需下载我的世界浏览器秒玩

2026-02-27 09:55

oppo系列手机价格表 OPPO不同系列价格区间对比

2026-02-27 09:56

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

391

2023.10.18

500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

349

2023.10.25

磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制，就是管理员可以为用户所能使用的磁盘空间进行配额限制，每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容，教程，供大家免费下载安装。

1541

2023.06.21

如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章，还有相关的下载、课程，大家可以免费体验。

715

2023.06.29

linux find

find是linux命令，它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合，只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression，在命令列上第一个 - ( ) , ! 之前的部分为 path，之后的是 expression。还有指DOS 命令 find，Excel 函数 find等。本站专题提供linux find相关教程文章，还有相关

300

2023.06.30

linux修改文件名

本专题为大家提供linux修改文件名相关的文章，这些文章可以帮助用户快速轻松地完成文件名的修改工作，大家可以免费体验。

793

2023.07.05

linux系统安装教程

linux系统是一种可以免费使用，自由传播，多用户、多任务、多线程、多CPU的操作系统。本专题提供linux系统安装教程相关的文章，大家可以免费体验。

585

2023.07.06

linux查看文件夹大小

Linux是一种自由和开放源码的类Unix操作系统，存在着许多不同的Linux版本，但它们都使用了Linux内核。Linux可安装在各种计算机硬件设备中，比如手机、平板电脑、路由器、视频游戏控制台、台式计算机、大型机和超级计算机。linux怎么查看文件夹大小呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

566

2023.07.20

Golang 测试体系与代码质量保障：工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链（如go test）、单元测试、集成测试及端到端测试实践，结合代码覆盖率分析、静态代码扫描（如go vet）和动态分析工具，建立全链路质量监控机制。通过自动化测试框架、持续集成（CI）流水线配置及代码审查规范，实现测试用例管理、缺陷追踪与质量门禁控制，确保代码健壮性与可维护性，为高可靠性工程系统提供质量保障。

2026.02.28

热门下载

网站特效

网站源码

网站素材

前端模板