博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

hashlib

Posted on 2015-07-06 14:28  bw_0927  阅读(129)  评论(0)    收藏  举报

说到加密,首先要了解加密的基本知识:hash加密,对称加密,不对称加密,数字签名等等。

 

Python中的用于加密的函数位于hashlib,hmac模块中,都是内置模块,直接导入即可使用

hashlib模块实现了md5,sha1,sha224,sha256,sha384,sha512等算法,可以通过hashlib.algorithms_available查看

 

 

import hashlib
md5 = hashlib.md5() #创建一个MD5加密对象
md5.update("JGood is a handsome boy")  #更新要加密的数据
print md5.digest()  #加密后的结果(二进制)
print md5.hexdigest() #加密后的结果,用十六进制字符串表示。
print 'block_size:', md5.block_size         hash内部块的大小
print 'digest_size:', md5.digest_size     结果hash的大小

  

hash.digest_size

以字节为单位的哈希结果的大小。

hash.block_size

以字节为单位的哈希算法的内部块的大小。

 

sha算法一样,只不过将md5方法换成相应的sha方法。不同的是sha算法执行出的结果更长,相应的比md5计算过程稍慢,所以md5经常用来做用户密码的存储。而sha1则经常用作数字签名。

 

http://www.cnblogs.com/the4king/archive/2012/02/06/2340660.html

SHA1基于MD5,加密后的数据长度更长,比MD5更加安全,但SHA1的运算速度就比MD5要慢了。

Python 中的用法:

Python 内置的 hashlib 模块就包括了 md5 和 sha1 算法。而且使用起来也极为方便

 

Example of MD5:

1 import hashlib
2
3 data = 'This a md5 test!'
4 hash_md5 = hashlib.md5(data)
5
6 hash_md5.hexdigest()

会输出:

1 '0a2c0b988863f08471067903d8737962'

上面这段字符串就是 data 转换后的MD5值。

 

MD5不仅仅是上面这个例子这样用来处理字符串,还有更广泛的用途:

  • 加密网站注册用户的密码。 (但去年的各大网站密码泄漏事件确实让人蛋疼……)
  • 网站用户上传图片 / 文件后,计算出MD5值作为文件名。(MD5可以保证唯一性)
  • key-value数据库中使用MD5值作为key。
  • 比较两个文件是否相同。(大家在下载一些资源的时候,就会发现网站提供了MD5值,就是用来检测文件是否被篡改)
  • ……

 

sha1的使用与MD5类似,就像下面这样,所以不再讲解SHA1:

import hashlib

hashlib.sha1('This is a sha1 test!').hexdigest()

 

 

处理大文件:

上面说过可以用MD5来检测两个文件是否相同,但想想,如果是两个很大的文件,担心内存不够用,这时怎么办?

这就要使用 update 方法了。代码如下:

复制代码
import hashlib

def get_file_md5(f):
m = hashlib.md5()

while True:
data = f.read(10240)
if not data:
break

m.update(data)
return m.hexdigest()


with open(YOUR_FILE, 'r') as f:
file_md5 = get_file_md5(f)
复制代码

(windows 用户 要使用 'rb'方式打开文件)

 

大家可以用下面这段代码验证一下:

复制代码
import hashlib

x = hashlib.md5()
x.update('hello, ')
x.update('python')
x.hexdigest()

hashlib.md5('hello, python').hexdigest()
复制代码

 

这两次的输出是一样的。
SHA1 也是一样的用法。