0

0

Linux系统突然宕机_宕机日志排查思路

冷漠man

冷漠man

发布时间:2026-03-15 16:13:02

|

463人浏览过

|

来源于php中文网

原创

Linux系统宕机应优先分析dmesg和/var/log/kern.log中panic、OOM、IO error等内核级信号,再用journalctl按启动编号与时间窗追溯事件链,同步排查硬件故障与kdump转储文件。

linux系统突然宕机_宕机日志排查思路

Linux系统突然宕机,日志是唯一能回溯真相的线索。关键不是“看所有日志”,而是按时间、层级和特征快速聚焦——先锁定崩溃瞬间的内核级信号,再顺藤摸瓜查关联异常。

一、优先抓取内核崩溃现场

宕机往往由内核级错误触发,/var/log/kern.logdmesg 是第一响应源:

  • 立即执行 sudo dmesg -T | tail -30,查看带时间戳的最近30条内核消息,重点关注含 panicOopsBUGout of memoryIO error 的行
  • 若系统已重启,检查 /var/log/kern.log 中崩溃前最后几秒的记录:sudo grep -i "panic\|fail\|error" /var/log/kern.log | tail -15
  • 注意时间断层:如果日志里突然缺失几分钟,可能说明系统在那段时间已无响应或日志服务自身挂了

二、用 journalctl 锁定崩溃时间窗

systemd 日志能串联系统服务、内核、用户进程行为,适合还原完整事件链:

In3D
In3D

把真人变成化身,创建逼真且可自定义的虚拟角色

下载
  • 先确认最后一次正常启动时间:sudo journalctl --list-boots,找到宕机前那次 boot 的编号(如 -2
  • 针对性查看该次启动末期的日志:sudo journalctl -b -2 --since "2026-03-08 22:45:00" --until "2026-03-08 22:52:00"(替换为实际可疑时间段)
  • 过滤高危信号:sudo journalctl -b -2 | grep -E "(emergency|alert|critical|error|panic)"

三、排查硬件与底层资源异常

很多“无故宕机”实为硬件故障或资源耗尽的表象,日志中常有隐性提示:

  • 内存问题:dmesg 中出现 Hardware name: ... Memory failurePage allocation failure,配合 sudo smartctl -a /dev/sda 检查磁盘 SMART 状态
  • 存储故障:/var/log/messages 中反复出现 end_request: I/O errorataX.00: failed command,说明硬盘或控制器异常
  • 过热/电源不稳:dmesg 或 IPMI 日志(ipmitool sdr)中出现 Thermal eventPower supply failure

四、检查是否启用并捕获了内核转储

若配置了 kdump,/var/crash/ 下会有 vmcore 文件,这是最直接的崩溃证据:

  • 确认 kdump 是否运行:sudo systemctl status kdump
  • 查看是否有新转储:ls -lt /var/crash/,找最近生成的 vmcoredump* 文件
  • 用 crash 工具分析(需对应内核调试符号包):crash /usr/lib/debug/boot/vmlinux-$(uname -r) /var/crash/vmcore,进入后输入 bt 查看崩溃调用栈

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

493

2023.10.18

500error怎么解决
500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

382

2023.10.25

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

448

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

606

2023.08.10

alert怎么实现换行
alert怎么实现换行

alert通过使用br标签来实现换行。更多关于alert相关的问题,详情请看本专题下面的文章。php中文网欢迎大家前来学习。

501

2023.11.07

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1564

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

716

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

300

2023.06.30

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

69

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 10.7万人学习

Git 教程
Git 教程

共21课时 | 4.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号