0

0

Linux 运维如何支撑业务快速扩展

舞夢輝影

舞夢輝影

发布时间:2026-02-11 20:56:02

|

977人浏览过

|

来源于php中文网

原创

CPU突增却查不到热点进程,因短命进程、内核线程或容器子进程未被top捕获;需用ps、pidstat、/proc/pid/stack多维度排查。

linux 运维如何支撑业务快速扩展

服务扩容时 CPU 突增却查不到热点进程?tophtop 不够用

说明:业务流量一涨,top 显示 CPU 使用率飙升,但排序后前几名进程加起来只占 30%,剩下 70% “黑盒”里跑着啥?常见于短生命周期进程、内核线程、或容器内未暴露的子进程。

实操建议:

  • 先跑 ps -eo pid,ppid,comm,%cpu --sort=-%cpu | head -20,看是否有大量同名短命进程(比如 curlshpython 脚本)
  • pidstat -t 1 观察线程级 CPU,确认是否是某个进程内部线程打满(如 Java 应用 GC 线程、Node.js 事件循环阻塞)
  • 检查 /proc//stack(需 root)看内核栈,排除 nf_conntrack 打满、ext4 日志锁、或 NFS 客户端卡住等内核态问题

横向扩容器后连接数不均,iptables SNAT 规则成瓶颈

说明:K8s 或自建集群加节点后,新 Pod 的出向连接集中在少数宿主机上,netstat -s | grep -i "conn failed" 出现大量 connection failed,本质是 iptables 的 CONNMARK + SNAT 规则在高并发下哈希冲突+锁竞争。

实操建议:

  • 避免在 POSTROUTING 链中对所有流量做 SNAT;改用 ip rule + ip route 基于源地址路由,或启用 nf_conntrack_hashsize 调大哈希桶(需重启模块)
  • 若必须用 iptables,把 SNAT 规则拆到不同链(如 SNAT-0SNAT-1),配合 ipset 分流,降低单链匹配开销
  • 检查 sysctl net.netfilter.nf_conntrack_max 和当前连接数(cat /proc/sys/net/netfilter/nf_conntrack_count),超 80% 就要调或清理老化连接

Ansible 批量部署失败,Connection refused 却能 ssh 手动连通

说明:Ansible 报 Connection refused,但人肉 ssh user@host 没问题——大概率是 Ansible 默认用 paramiko 实现 SSH,而目标机 sshd_config 中禁用了 PubkeyAuthentication no 或启用了 UsePAM yes 导致 paramiko 认证路径异常。

Colourlab.ai
Colourlab.ai

好莱坞内容创作者依赖的AI色彩分级软件

下载

实操建议:

  • ansible.cfg 中强制走 OpenSSH:添加 [defaults]transport = ssh
  • 检查目标机 /var/log/secure,搜索 Failed passwordauthentication failure,确认是否被 PAM 拦截(比如 pam_faillock 锁了用户)
  • 避免在 inventory 中混用密码和密钥认证;统一用 --private-key 指定密钥,并确保权限为 600,否则 OpenSSH 会静默拒绝

systemd 服务依赖启动慢,systemctl start 卡住 90 秒

说明:写了个新服务 A,After=B.service,但 B 已运行,A 启动仍卡住。根本原因是 B.serviceType=notify 但没发 sd_notify("READY=1"),systemd 等超时(默认 DefaultTimeoutStartSec=90s)才放弃。

实操建议:

  • systemctl show A.service | grep TimeoutStartSec 确认实际超时值
  • Type=notify 服务,必须在代码中调用 sd_notify(0, "READY=1")(C)、systemd.daemon.notify("READY=1")(Python)、或用 systemd-notify --ready(Shell)
  • 若无法改代码,临时改 A.service:加 Wants=B.service 但去掉 After=,再用 ExecStartPre=/bin/sh -c 'while ! systemctl is-active --quiet B.service; do sleep 1; done' 主动轮询

业务扩展不是堆机器,是让每台机器的资源、连接、部署、启动都可预期。最容易被跳过的,永远是 systemd 的 notify 信号、nf_conntrack 的哈希大小、以及 Ansible 底层到底走的是哪个 SSH 实现。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

399

2023.09.04

while的用法
while的用法

while的用法是“while 条件: 代码块”,条件是一个表达式,当条件为真时,执行代码块,然后再次判断条件是否为真,如果为真则继续执行代码块,直到条件为假为止。本专题为大家提供while相关的文章、下载、课程内容,供大家免费下载体验。

101

2023.09.25

curl_exec
curl_exec

curl_exec函数是PHP cURL函数列表中的一种,它的功能是执行一个cURL会话。给大家总结了一下php curl_exec函数的一些用法实例,这个函数应该在初始化一个cURL会话并且全部的选项都被设置后被调用。他的返回值成功时返回TRUE, 或者在失败时返回FALSE。

450

2023.06.14

linux常见下载安装工具
linux常见下载安装工具

linux常见下载安装工具有APT、YUM、DNF、Snapcraft、Flatpak、AppImage、Wget、Curl等。想了解更多linux常见下载安装工具相关内容,可以阅读本专题下面的文章。

179

2023.10.30

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

410

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

586

2023.08.10

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

410

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

586

2023.08.10

2026春节习俗大全
2026春节习俗大全

本专题整合了2026春节习俗大全,阅读专题下面的文章了解更多详细内容。

68

2026.02.11

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 8.9万人学习

Git 教程
Git 教程

共21课时 | 3.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号