Linux 服务日志分析与故障排查

舞姬之光

发布时间：2026-02-13 18:47:03

611人浏览过

来源于php中文网

原创

快速定位 systemd 服务实时日志应使用 journalctl -u -f，避免依赖 /var/log/；需加 -f 实时跟踪、-u 精确服务、--since 防轮转丢失、--all 查截断长行，并用结构化过滤（如 -p err）替代盲目 grep。

linux 服务日志分析与故障排查

怎么快速定位 `systemd` 服务的实时日志

直接用 journalctl -u <service-name> -f</service-name>，别先翻 /var/log/ 下的文件——很多现代服务（比如 nginx、docker）默认不写传统日志，全走 journald。

常见错误是加了 -n 100 就以为能“看到最新”，其实没 -f 就只是快照；漏掉 -u 则会混入内核或其它服务日志，干扰判断。

-u ssh 比 -u sshd 更可靠——有些发行版单元名就是 ssh.service
加 --since "2 hours ago" 比手动翻页更准，避免因日志轮转丢记录
如果服务刚挂过，加 --all 才能看到被截断的长行（比如堆栈或 JSON 日志）

`grep` 日志时为什么总漏关键行

因为默认只匹配完整行，而错误常跨行出现（比如 Java 异常的 Caused by: 在下一行），或被日志框架加了前缀（如 [ERROR] 或时间戳）干扰模式匹配。

别直接 grep "timeout"，先用 journalctl -u app | head -20 看真实格式，再决定要不要去前缀、是否要跨行。

用 journalctl -u app --no-pager | grep -A 2 -B 1 "Connection refused" 抓上下文
匹配带颜色的日志？加 --no-color，否则 grep 会被 ANSI 转义符卡住
想排除健康检查日志？用 grep -v "GET /health"，但注意有些服务把错误也打在 /health 响应体里，得看 body

服务起不来，`systemctl status` 只显示 `failed` 怎么办

systemctl status 只展示最近一次启动的摘要，真正原因藏在 journalctl 的启动阶段日志里——尤其是 ExecStart= 对应的进程刚 fork 就退出时，错误往往只在启动瞬间输出。

剪刀手

全自动AI剪辑神器：日剪千条AI原创视频，零非原创风险，批量高效制作引爆流量！免费体验，轻松上手！

下载

必须加 --boot 和 -o short-precise：前者确保查的是当前 boot 的日志（不是上一次崩溃残留），后者让时间戳精确到微秒，方便对齐进程生命周期。

先运行 systemctl show -p ExecStart <service></service> 确认实际执行命令，再手动跑一遍，看是否缺环境变量或权限
如果报 Failed at step EXEC spawning，大概率是二进制路径错、动态库找不到，或 SELinux 拦截（查 ausearch -m avc -ts recent）
systemctl reset-failed <service></service> 不解决根本问题，只是清状态——别把它当修复手段

日志太多，怎么筛出真正影响服务可用性的条目

不是所有 ERROR 都致命。关注三类信号：exit code 非零、panic/segfault、以及反复出现的连接类失败（如 connect: connection refused）。其余多数是业务级告警，可延后处理。

用 journalctl 的结构化过滤比纯文本 grep 更稳：它支持按优先级（-p err）、进程 ID（_PID=1234）、甚至容器 ID（_CONTAINER_NAME=web）筛选。

journalctl -u app -p err --since "5 minutes ago" 比 grep ERROR 准，因为有些日志把 INFO 写成大写
发现大量 connection reset by peer？别急着查服务本身，先用 ss -tuln | grep :端口 确认端口真在监听
日志里频繁出现 Too many open files？立刻查 cat /proc/<pid>/limits | grep "Max open files"</pid>，别只调 ulimit 配置

最麻烦的其实是日志没报错但服务没响应——这时候得切到网络层，用 tcpdump 或 strace -p <pid> -e trace=sendto,recvfrom</pid> 看它到底收没收到请求。

Linux LVM 快照使用实践

Linux 人工操作与自动化的边界划分

Linux namespaces 的六大类型（pid/net/mount/user/uts/ipc）隔离边界说明

Linux 日志分析与故障排查方法

Linux RAID 类型选择与配置方法

相关标签:

linux nginx json Error 栈堆 var docker tcpdump linux ssh

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：chronyc sources 显示 no selectable sources 的 allow / deny 配置下一篇：暂无

作者最新文章

发票抽奖要满足什么条件才能抽发票抽奖是真的吗怎么参与

2026-02-13 11:09

发票抽奖没有发票代码怎么办发票抽奖怎么参加

2026-02-13 11:43

发票抽奖在哪查询发票抽奖查询官网入口网页

2026-02-13 11:45

两新补贴政策怎么领取？两新补贴攻略指南【教程】

2026-02-13 11:46

住房个税退税不同城可以退吗换购住房个税退税全指南(2026最新版

2026-02-13 11:49

IQOO手机各个型号参数一览表 IQOO全系列型号参数汇总

2026-02-13 12:04

崩坏:星穹铁道4.0最新兑换码星铁4.0免费兑换码活动入口

2026-02-13 12:05

终末地影拓丰碑攻略平民影拓丰碑全满星教程

2026-02-13 12:13

崩坏:星穹铁道4.0卡池抽取建议星铁4.0角色强度榜

2026-02-13 12:13

《明日方舟终末地》影拓丰碑第一期配队打法攻略【平民】

2026-02-13 12:17

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

nginx 重启

nginx重启对于网站的运维来说是非常重要的，根据不同的需求，可以选择简单重启、平滑重启或定时重启等方式。本专题为大家提供nginx重启的相关的文章、下载、课程内容，供大家免费下载体验。

239

2023.07.27

nginx 配置详解

Nginx的配置是指设置和调整Nginx服务器的行为和功能的过程。通过配置文件，可以定义虚拟主机、HTTP请求处理、反向代理、缓存和负载均衡等功能。Nginx的配置语法简洁而强大，允许管理员根据自己的需要进行灵活的调整。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

514

2023.08.04

nginx配置详解

NGINX与其他服务类似，因为它具有以特定格式编写的基于文本的配置文件。本专题为大家提供nginx配置相关的文章，大家可以免费学习。

564

2023.08.04

tomcat和nginx有哪些区别

tomcat和nginx的区别：1、应用领域；2、性能；3、功能；4、配置；5、安全性；6、扩展性；7、部署复杂性；8、社区支持；9、成本；10、日志管理。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

237

2024.02.23

nginx报404怎么解决

当访问 nginx 网页服务器时遇到 404 错误，表明服务器无法找到请求资源，可以通过以下步骤解决：1. 检查文件是否存在且路径正确；2. 检查文件权限并更改为 644 或 755；3. 检查 nginx 配置，确保根目录设置正确、没有冲突配置等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

456

2024.07.09