在网络传输、设备之间转存、复制大文件等时,可能会出现传输前后数据不一致的情况。这种情况在网络这种相对更不稳定的环境中,容易出现。那么校验文件的完整性,也是势在必行的。
md5sum命令用于生成和校验文件的md5值。它会逐位对文件的内容进行校验。是文件的内容,与文件名无关,也就是文件内容相同,其md5值相同。md5值是一个128位的二进制数据,转换成16进制则是32(128/4)位的进制值。
md5校验,有很小的概率不同的文件生成的md5可能相同。比md5更安全的校验算法还有SHA*系列的。
在网络传输时,我们校验源文件获得其md5sum,传输完毕后,校验其目标文件,并对比如果源文件和目标文件md5 一致的话,则表示文件传输无异常。否则说明文件在传输过程中未正确传输。
-b 以二进制模式读入文件内容
-t 以文本模式读入文件内容
-c 根据已生成的md5值,对现存文件进行校验
--status 校验完成后,不生成错误或正确的提示信息,可以通过命令的返回值来判断。
--tag BSD格式查看 MD5 值
#md5sum test.py 默认是 -t
e0c4f052aa5559ed9371411bd5f416e8 test.py
#md5sum -b test.py
e0c4f052aa5559ed9371411bd5f416e8 *test.py
#md5sum -t test.py
e0c4f052aa5559ed9371411bd5f416e8 test.py
-c 选项来对文件md5进行校验。校验时,根据已生成的md5来进行校验。生成当前文件的md5,并和之前已经生成的md5进行对比,如果一致,则返回OK,否则返回错误信息
#md5sum test* >d.md5
md5sum: test_clone_code: Is a directory
md5sum: test_path: Is a director
#cat d.md5
e0c4f052aa5559ed9371411bd5f416e8 test.py
7fd7d3329755979e673b05e926054a99 test.txt
#md5sum -c d.md5
test.py: OK
test.txt: OK
#test.txt有改变
#echo "dshdhlshclk" >>test.txt
#md5sum -c d.md5
test.py: OK
test.txt: FAILED
md5sum: WARNING: 1 computed checksum did NOT match
--status,不显示校验信息,以命令返回值来判断
校验一致返回0,不一致返回1
# md5sum -c --status d.md5
#echo $?
0
--tag BSD格式查看 MD5 值
#md5sum --tag d.md5
MD5 (d.md5) = 6585ec7c2e5e9a3d21ece9aba821eb73
diff -c 比较两个文件差别
#md5sum test.txt >b.md5
#diff -c b.md5 d.md5
*** b.md5 2022-03-09 14:20:53.999821690 +0800
--- d.md5 2022-03-09 14:03:12.389732202 +0800
***************
*** 1 ****
! c3f784752f361f586db036d9e933b09c test.txt
--- 1,2 ----
! e0c4f052aa5559ed9371411bd5f416e8 test.py
! 7fd7d3329755979e673b05e926054a99 test.txt
1、md5sum 是校验文件内容,与文件名是否相同无关
2、md5sum值逐位校验,所以文件越大,校验时间越长
1、https://www.cnblogs.com/zhuxiaohou110908/p/5786893.html
2、https://www.cnblogs.com/miracle-luna/p/11967246.html