Python里面可以通过hashlib来加密文件。hashlib可以支持多种加密,以最常见的md5为例,我们可以用来加密用户的输入密码,然后保存在数据库里。
例1 加密字符串
import hashlib obj = hashlib.md5(bytes(‘1111‘, encoding=‘utf-8‘)) obj=hashlib.md5() obj.update(bytes(‘123‘, encoding=‘utf8‘)) obj.update(bytes(‘456‘,encoding=‘utf8‘)) result = obj.hexdigest() print(obj) print(obj.digest()) print(result) ---------------- <md5 HASH object @ 0x101d839b0> b‘\xe1\n\xdc9I\xbaY\xab\xbeV\xe0W\xf2\x0f\x88>‘ e10adc3949ba59abbe56e057f20f883e
值得注意的有几点:
首先通过hashlib.md5()生成一个对象;然后调用这个对象的方法update去生成对应的md5 checksum,然后打印出来;
我对字符串‘123’,‘456’的字节分别执行了update的操作,那么最后他的md5结果和‘123456’的字节其实是一样的。通过类似的方法,我们可以把一个很大的文件分字节的读入。
hexdigest()和digest()的区别 前者输出的是2进制 后者是一个16进制的摘要
因为md5可以通过撞库来破解,因此可以通过 obj=hashlib.md5(bytes(‘111‘,encoding=‘utf8))再加一次密,这样撞库的几率就大为降低了。
例2 加密文件
import hashlib def md5(fname): hash_md5 = hashlib.md5() with open(fname, "rb") as f: for chunk in iter(lambda: f.read(4096), b""): hash_md5.update(chunk) return hash_md5.hexdigest() dd=md5(‘index.py‘) print(dd) ----------------------- 06fd2a2b98ff2e333bc9861dfb8048de
注意事项:
因为文件可能很大,所以每次只读取4096个字节进行转换。最后返回最终的md5 checksum。
注意这一句 iter()的使用,第一个参数是返回的f.read(4096)个字节码的迭代器,第二个参数b"" 表示直到这个参数才迭代结束,换句话说相当于一个循环,每次读取4096个字节码,直到为空
for chunk in iter(lambda: f.read(4096), b"")
最后的MD5结果和我直接在OSX Shell里面操作是一样的
jip-ise:week6 yli$ md5 index.py MD5 (index.py) = 06fd2a2b98ff2e333bc9861dfb8048de
本文出自 “麻婆豆腐” 博客,请务必保留此出处http://beanxyz.blog.51cto.com/5570417/1854933
原文地址:http://beanxyz.blog.51cto.com/5570417/1854933