grep、sed、awk是麒麟OS中高效文本处理的三大核心命令行工具:grep用于模式匹配与筛选,sed用于流式编辑,awk用于结构化分析,三者可管道组合实现复杂任务,并需注意麒麟OS特有的环境适配。

如果您在麒麟OS系统中需要高效地进行文本搜索、编辑和分析,grep、sed、awk这三个命令行工具提供了强大且互补的能力。以下是它们在麒麟OS环境下的典型应用方式:
一、使用grep进行模式匹配与内容筛选
grep用于在文件或输入流中查找符合正则表达式或固定字符串的行,是快速定位关键信息的基础工具。它支持递归搜索、忽略大小写、显示行号等多种选项,适用于日志排查、配置检查等场景。
1、在当前目录所有.conf文件中搜索包含“listen”的行:
grep "listen" *.conf
2、递归搜索/etc目录下所有文件中含“root”且不区分大小写的行:
grep -r -i "root" /etc/
3、显示匹配行及其前后各两行,便于查看上下文:
grep -A 2 -B 2 "error" /var/log/syslog
4、仅输出匹配行的行号和文件名:
grep -nH "failed" /var/log/auth.log
二、使用sed进行流式文本编辑
sed以行为单位对输入流执行非交互式编辑操作,常用于替换、删除、插入和提取文本内容,无需打开文件即可完成批量修改,适合脚本自动化处理。
1、将test.txt中所有“old”替换为“new”,并保存到新文件:
sed 's/old/new/g' test.txt > new.txt
2、直接修改原文件(需加-i参数),将第一行中的“#”开头注释行删除:
sed -i '/^#/d' config.ini
3、提取文件中第5至10行的内容:
sed -n '5,10p' data.log
4、在每行末尾添加字符串“; processed”:
sed 's/$/; processed/' input.txt
三、使用awk进行结构化文本分析
awk按字段(默认空格或制表符分隔)解析文本,支持变量、条件判断、循环和内置函数,特别适合处理日志、CSV、系统命令输出等列式数据。
1、显示ps命令输出中CPU使用率大于10%的进程名和PID:
ps aux --sort=-%cpu | awk '$3 > 10 {print $2, $11}'
2、统计/var/log/secure中每个IP地址的登录失败次数:
awk '/Failed password/ {print }' /var/log/secure | sort | uniq -c | sort -nr
3、计算文件file.csv中第二列数值的总和:
awk -F',' '{sum += $2} END {print sum}' file.csv
4、打印df命令输出中使用率超过85%的挂载点名称及百分比:
df -h | awk '$5 ~ /[0-9]+%/ && substr($5,1,length($5)-1) > 85 {print $1, $5}'
四、组合使用grep、sed、awk实现复杂文本处理
三者可通过管道符串联,各自承担过滤、编辑、分析职责,形成高效处理链。这种组合避免了临时文件生成,提升执行效率并增强可读性。
1、从journalctl日志中提取最近10分钟内所有systemd服务启动失败的单元名:
journalctl --since "10 minutes ago" | grep "failed to start" | awk '{print $6}' | sed 's/\.$//'
2、清理nginx访问日志中非200状态码的请求,并提取客户端IP与响应时间(假设格式为:IP - - [time] "GET..." 404 123 0.045):
grep -v ' 200 ' /var/log/nginx/access.log | awk '{print $1, $NF}' | sed 's/"$//'
3、获取当前运行中容器的镜像名与端口映射,过滤掉无端口暴露的条目:
docker ps --format "{{.Image}} {{.Ports}}" | grep ":" | awk '{print $1, $2}'
4、从ls -l输出中提取权限为755且属主为当前用户的文件名:
ls -l | awk '$1 ~ /^-rwxr-xr-x$/ && $3 == ENVIRON["USER"] {print $9}'
五、麒麟OS特有适配注意事项
麒麟OS基于Linux内核,但部分预装组件或安全策略可能影响工具行为。例如,默认shell可能为bash或dash,某些awk变种(如mawk)可能被选用,需确认实际路径与版本兼容性。
1、验证当前系统所用awk实现:
awk --version 或 ls -l $(which awk)
2、若遇到中文路径或日志乱码,需确保LANG环境变量设为zh_CN.UTF-8:
export LANG=zh_CN.UTF-8
3、在受限权限环境中执行sed -i时,可能因只读文件系统报错,应先确认目标文件可写:
ls -l /etc/hostname
4、麒麟OS桌面版默认启用SELinux或类似强制访问控制机制,若grep无法读取某些日志,需检查安全上下文:
ls -Z /var/log/audit/audit.log










