0

0

Linux怎么比较两个文件差异_Linux diff命令使用技巧【对比】

穿越時空

穿越時空

发布时间:2026-02-20 09:27:33

|

266人浏览过

|

来源于php中文网

原创

diff 默认只显示行级差异,不标出同一行内字符变化;需用 -u 配合 diff-highlight、git diff --word-diff 或 xxd 转换后比较;二进制文件应使用 cmp 或 sha256sum 判断异同。

linux怎么比较两个文件差异_linux diff命令使用技巧【对比】

diff 命令默认只显示行差异,不显示具体字符变化

你用 diff file1.txt file2.txt 看到的只是哪些行增删了,但同一行里只改了一个字母(比如 catcar),它不会标出 t 变成了 r。这是默认行为,不是 bug。

想看到字符级差异,得加 -u(统一格式)配合 colordiff 或用 git diff --no-index

git diff --no-index --word-diff=plain file1.txt file2.txt

注意:--word-diff 在老版本 Git 里不支持 --no-index,Git 2.9+ 才稳定可用。

  • 纯命令行环境没装 Git?用 diff -u file1.txt file2.txt | diff-highlight(需先 apt install diff-highlight 或从 git 源码里复制脚本)
  • diff -y(并排模式)看着直观,但遇到长行会自动换行,导致对齐错乱,别在自动化脚本里用
  • 空格变化默认被忽略——除非加 -b(忽略空白符)或 -w(更激进地忽略所有空白),否则 hello<space></space>hello 会被当成两行不同

二进制文件直接 diff 会提示 “Binary files differ” 就停住

diff 对非文本文件非常保守:只要文件头有零字节或检测到 NUL 字符,就放弃逐行比较,直接输出 Binary files a and b differ。它不报错,也不继续——这容易让人误以为“没差异”,其实只是没告诉你。

真要比较二进制文件是否完全一致,用 cmp 更准:

cmp -l file1.bin file2.bin | head -20

cmp -l 会列出所有字节不同的位置和值(八进制),head 是防止刷屏。如果完全一样,就什么也不输出。

  • MD5/SHA 校验适合快速判断是否相同,但无法定位差异位置:sha256sum file1.bin file2.bin
  • 想看二进制 diff 的“可读形式”?xxd file1.bin | diff -u - ,但大文件会很慢,内存占用高
  • diff --brief(即 -q)能安静判断是否相同,输出只有“Files a and b differ”或无输出,适合写进 shell 判断逻辑

递归比较目录时,-r 不等于 “智能同步”

diff -r dir1 dir2 是逐个文件调用 diff,但它完全不管软链接指向、文件权限、修改时间、SELinux 上下文这些元数据。两个目录内容一致,但一个里 script.sh 是 755,另一个是 644,diff -r 仍显示“no difference”。

AletheaAI
AletheaAI

世界上第一个从自然语言描述中生成交互式 AI 角色的多模态 AI 系统。

下载

如果你实际想确认“能不能 rsync 过去不出错”,光靠 diff -r 不够:

  • 权限/属主差异:用 diff ,但注意路径顺序和排序稳定性
  • 忽略特定文件:加 --exclude='*.log'--exclude-dir='.git',否则可能卡在 node_modules 里
  • diff -r 遇到只在一个目录存在的子目录,会直接报 Only in dir1: xxx,但不会递归进那个目录再比——这是设计如此,不是漏了

diff 输出里 “12a13,15” 这类标记怎么读

这是 ed 编辑器风格地址标记,现在看着反直觉,但理解后查问题很快。以 12a13,15 为例:

  • 12:原文件第 12 行
  • a:append(在它后面添加)
  • 13,15:目标文件第 13 到 15 行的内容

也就是说:要在原文件第 12 行之后插入目标文件的 13–15 行。类似地,5c5,6 表示“把原文件第 5 行改成目标文件第 5–6 行”。

新手常误以为数字是“差异行号”,其实左边是原文件上下文,右边是目标文件上下文,中间字母含义固定:a=add,d=delete,c=change。

真正在脚本里解析这个格式?别自己手撕——用 diff -u 输出,然后交给 patch 或 Python 的 difflib 处理,人眼友好得多。

最常被忽略的是:diff 默认不保证输出顺序绝对稳定。如果两个文件都有多处小修改,不同 locale 下排序可能微变,做自动化比对前记得设 LC_ALL=C diff ...

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
自建git服务器
自建git服务器

git服务器是目前流行的分布式版本控制系统之一,可以让多人协同开发同一个项目。本专题为大家提供自建git服务器相关的各种文章、以及下载和课程。

938

2023.07.05

git和svn的区别
git和svn的区别

git和svn的区别:1、定义不同;2、模型类型不同;3、存储单元不同;4、是否拥有全局版本号;5、内容完整性不同;6、版本库不同;7、克隆目录速度不同;8、分支不同。php中文网为大家带来了git和svn的相关知识、以及相关文章等内容。

577

2023.07.06

git撤销提交的commit
git撤销提交的commit

Git是一个强大的版本控制系统,它提供了很多功能帮助开发人员有效地管理和控制代码的变更,本专题为大家提供git 撤销提交的commit相关的各种文章内容,供大家免费下载体验。

273

2023.07.24

git提交错误怎么撤回
git提交错误怎么撤回

git提交错误撤回的方法:git reset head^:撤回最后一次提交,恢复到提交前状态。git revert head:创建新提交,内容与之前提交相反。git reset :使用提交的 sha-1 哈希撤回指定提交。交互式舞台区:标记要撤回的特定更改,然后提交,排除已撤回更改。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

567

2024.04.09

git怎么对比两个版本的文件内容
git怎么对比两个版本的文件内容

要对比两个版本的 git 文件,请使用 git diff 命令:git diff 比较工作树和暂存区之间的差异。git diff 比较两个提交或标签之间的差异。git diff 输出显示差异块,其中 + 表示添加的行,- 表示删除的行, 表示修改的行。可使用 gitkraken、meld、beyond compare 等可视化工具更直观地查看差异。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

532

2024.04.09

磁盘配额是什么
磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制,就是管理员可以为用户所能使用的磁盘空间进行配额限制,每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容,教程,供大家免费下载安装。

1542

2023.06.21

如何安装LINUX
如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章,还有相关的下载、课程,大家可以免费体验。

715

2023.06.29

linux find
linux find

find是linux命令,它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合,只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression,在命令列上第一个 - ( ) , ! 之前的部分为 path,之后的是 expression。还有指DOS 命令 find,Excel 函数 find等。本站专题提供linux find相关教程文章,还有相关

300

2023.06.30

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

6

2026.02.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 9.9万人学习

Git 教程
Git 教程

共21课时 | 3.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号