linux中有好几个文件对比命令有好几个,我今天介绍2个命令:comm、diff

comm命令

这个对比有个很大的缺陷,需要排序,有的时候哪怕你排序了,碰到行数不同的更是头疼,不是很好用,–help 可以查看帮助文档。

comm语法:

1
comm [option] file1 file2
  • 参数:
  • -1   不显示只在第1个文件里出现过的列。
  • -2   不显示只在第2个文件里出现过的列。
  • -3   不显示只在第1和第2个文件里出现过的列。(只2个文件差异内容)
  • -12 只显示两个文件相同部分
  • -13 只显示在第2个文件中出现(而未在第1个文件中出现的行)
  • -23 只显示在第1个文件中出现(而未在第2个文件中出现的行)

例:比较2个文件,并打打印相同部分(排序、去除,否则会出现comm错误告警)

[root@ffing ~]# cat 1.txt
a1
b12
b123
d1234
[root@ffing ~]# cat 2.txt
ab
abb
a2
acc
a1
a12
b12
b12
d1234
[root@ffing ~]# cat 1.txt sortuniq > 1.txt.bak
[root@ffing ~]# cat 2.txt sortuniq > 2.txt.bak
[root@ffing ~]# comm -12 1.txt.bak 2.txt.bak
a1
b12
d1234

diff命令

diff 功能比较强大,可以比较文件也可以比较目录,且可以直接输出比较结果,而不显示比较内容。

我使用diff常用环境

  • 1.直接对比文件是否有差异,无需加参数
  • 2.-c,文件相同不输出结果,文件不同时,标记输出差异结果
  • 3.-q, 不输出差异信息,只输出结果,shell中用的比较多

diff语法:

1
diff [-abBcdefHilnNpPqrstTuvwy][-][-C ][-D ][-I ][-S ][-W ][-x ][-X ][--help][--left-column][--suppress-common-line][文件或目录1][文件或目录2

参数:

  • -  指定要显示多少行的文本。此参数必须与-c或-u参数一并使用。
  • -a或–text  diff预设只会逐行比较文本文件。
  • -b或–ignore-space-change  不检查空格字符的不同。
  • -B或–ignore-blank-lines  不检查空白行。
  • -c  显示全部内文,并标出不同之处。
  • -C或–context  与执行”-c-“指令相同。
  • -d或–minimal  使用不同的演算法,以较小的单位来做比较。
  • -D或ifdef  此参数的输出格式可用于前置处理器巨集。
  • -e或–ed  此参数的输出格式可用于ed的script文件。
  • -f或-forward-ed  输出的格式类似ed的script文件,但按照原来文件的顺序来显示不同处。
  • -H或–speed-large-files  比较大文件时,可加快速度。
  • -l或–ignore-matching-lines  若两个文件在某几行有所不同,而这几行同时都包含了选项中指定的字符或字符串,则不显示这两个文件的差异。
  • -i或–ignore-case  不检查大小写的不同。
  • -l或–paginate  将结果交由pr程序来分页。
  • -n或–rcs  将比较结果以RCS的格式来显示。
  • -N或–new-file  在比较目录时,若文件A仅出现在某个目录中,预设会显示:
  • Only in目录:文件A若使用-N参数,则diff会将文件A与一个空白的文件比较。
  • -p  若比较的文件为C语言的程序码文件时,显示差异所在的函数名称。
  • -P或–unidirectional-new-file  与-N类似,但只有当第二个目录包含了一个第一个目录所没有的文件时,才会将这个文件与空白的文件做比较。
  • -q或–brief  仅显示有无差异,不显示详细的信息。
  • -r或–recursive  比较子目录中的文件。
  • -s或–report-identical-files  若没有发现任何差异,仍然显示信息。
  • -S或–starting-file  在比较目录时,从指定的文件开始比较。
  • -t或–expand-tabs  在输出时,将tab字符展开。
  • -T或–initial-tab  在每行前面加上tab字符以便对齐。
  • -u,-U或–unified=  以合并的方式来显示文件内容的不同。
  • -v或–version  显示版本信息。
  • -w或–ignore-all-space  忽略全部的空格字符。
  • -W或–width  在使用-y参数时,指定栏宽。
  • -x或–exclude  不比较选项中所指定的文件或目录。
  • -X或–exclude-from  您可以将文件或目录类型存成文本文件,然后在=中指定此文本文件。
  • -y或–side-by-side  以并列的方式显示文件的异同之处。
  • --help  显示帮助。
  • --left-column  在使用-y参数时,若两个文件某一行内容相同,则仅在左侧的栏位显示该行内容。
  • --suppress-common-lines  在使用-y参数时,仅显示不同之处。

diff比较两个文件,2个文件的差异都会标记处理,未标记的行是相同内容,如下

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

[root@bogon ~]# diff -c 1.txt 2.txt
*** 1.txt 2022-01-23 22:14:57.748722522 +0800
--- 2.txt 2022-01-23 22:18:20.048981200 +0800
***************
*** 1,5 ****
a1
b12
- b123
d1234
-
--- 1,9 ----
+ ab
+ abb
+ a2
+ acc
a1
+ a12
+ b12
b12
d1234