python中使用md5和sha1加密

西门靖琪
2023-12-01

MD5

MD5的全称是Message-Digest Algorithm 5(信息-摘要算法)。128位长度。目前MD5是一种不可逆算法。

具有很高的安全性。它对应任何字符串都可以加密成一段唯一的固定长度的代码。

 

SHA1

SHA1的全称是Secure Hash Algorithm(安全哈希算法) 。SHA1基于MD5,加密后的数据长度更长,

它对长度小于264的输入,产生长度为160bit的散列值。比MD5多32位。

因此,比MD5更加安全,但SHA1的运算速度就比MD5要慢了。

 

Python 中的用法:

Python 内置的 hashlib 模块就包括了 md5 和 sha1 算法。而且使用起来也极为方便

md5 example

import hashlib
data = 'this is md5 test'
md5 = hashlib.md5()
md5.update(data.encode('utf-8'))
hash_md5 = md5.hexdigest()
print(hash_md5)

sha1 example

import hashlib
data = 'this is sha1 test'
sha1 = hashlib.sha1(data.encode('utf-8')).hexdigest()
print(sha1)

 

处理大文件:

上面说过可以用MD5来检测两个文件是否相同,但想想,如果是两个很大的文件,担心内存不够用,这时怎么办?

这就要使用 update 方法了。代码如下:

import hashlib

def get_file_md5(f):
    m = hashlib.md5()
    while True:
        data = f.read(10240)
        if not data:
            break

        m.update(data.encode('utf-8'))
    return m.hexdigest()
with open('haslib_md5_sha1.py', 'r') as f:
    file_md5 = get_file_md5(f)
    print(file_md5)

大家可以用下面这段代码验证一下:输出的结果一样

import hashlib

x = hashlib.md5()
x.update('hello, '.encode('utf-8'))
x.update('python'.encode('utf-8'))
print(x.hexdigest())

print(hashlib.md5('hello, python'.encode('utf-8')).hexdigest())

 

 

 注意:

python3环境下,利用hash值对url进行 md5加密,时报错TypeError:Unicode-objects must be encode before hashing

原因是:

python3跟python2区别:python3下字符串为Unicode类型,而hash传递时需要的是utf-8类型,因此需要类型转换.
 

 类似资料: