常用模块之json、pickle、hashlib
常用模块之json、pickle、hashlib
一 json&pickle模块
1 什么是序列化
我们把对象(变量) 从内存中编程可存储或传输的过程,称之为序列化。在python中叫pickling,在其他语言中也称之为serialization,marshalling,flattening等等。
2 为何要序列化
2.1 持久保存状态。
将内存中的数据保存到文件中,下次程序执行可以从文件中载入之前的数据,就是序列化。
2.2 跨平台数据交互。
序列化之后的数据,可以通过网络传输,若有一种双方约定好的序列化格式,就可以实现跨平台数据交互。
3 如何序列化
3.1 json格式
如果我们要在不同的编程语言之间传递对象,就必须序列化为标准格式,json是一种很好的序列化格式,因为json表示出来就是一个字符串,可以被所有语言读取,可以方便网络传输。
json和python数据类型对比:


# JSON的基本使用
import json
dic={'name':'alvin','age':23,'sex':'male'}
print(type(dic))#<class 'dict'>
j=json.dumps(dic)
print(type(j))#<class 'str'>
f=open('序列化对象','w')
f.write(j) #-------------------等价于json.dump(dic,f)
f.close()
#-----------------------------反序列化<br>
import json
f=open('序列化对象')
data=json.loads(f.read())# 等价于data=json.load(f)
# 使用的注意点:
import json
#dct="{'1':111}"#json 不认单引号
#dct=str({"1":111})#报错,因为生成的数据还是单引号:{'one': 1}
dct='{"1":"111"}'
print(json.loads(dct))
#conclusion:
# 无论数据是怎样创建的,只要满足json格式,就可以json.loads出来,不一定非要dumps的数据才能loads
# 其他需要了解的
# 在python解释器2.7与3.6之后都可以json.loads(bytes类型),但唯独3.5不可以
>>> import json
>>> json.loads(b'{"a":111}')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/Users/linhaifeng/anaconda3/lib/python3.5/json/__init__.py", line 312, in loads
s.__class__.__name__))
TypeError: the JSON object must be str, not 'bytes'
3.2 pickle格式
由于pickle格式支持python所有数据类型,且仅支持python语言,因此在python存档的时候,使用pickle格式最好。

# pickle的基本使用
import pickle
dic={'name':'alvin','age':23,'sex':'male'}
print(type(dic))#<class 'dict'>
j=pickle.dumps(dic)
print(type(j))#<class 'bytes'>
f=open('序列化对象_pickle','wb')#注意是w是写入str,wb是写入bytes,j是'bytes'
f.write(j) #-------------------等价于pickle.dump(dic,f)
f.close()
#-------------------------反序列化
import pickle
f=open('序列化对象_pickle','rb')
data=pickle.loads(f.read())# 等价于data=pickle.load(f)
print(data['age'])
二 hashlib模块
1 什么叫hash
hash是一种算法(3.x里代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法) ,该算法接收传入的内容,经过运算得到一串hash值
2 hash值的三个特点
(1) 只要传入的内容一样,得到的hash值必然一样=====>要用明文传输密码文件完整性校验。
(2) 不可逆,不能由hash值反解成内容=======》把密码做成hash值,不应该在网络传输明文密码。
(3) 只要使用的hash算法不变,无论校验的内容有多大,得到的hash值长度是固定的。
3 如何使用hash
hash算法就像一座工厂,工厂接收你送来的原材料(可以用m.update()为工厂运送原材料) ,经过加工返回的产品就是hash值。

1 import hashlib
2
3 m=hashlib.md5()# m=hashlib.sha256()
4
5 m.update('hello'.encode('utf8'))
6 print(m.hexdigest()) #5d41402abc4b2a76b9719d911017c592
7
8 m.update('alvin'.encode('utf8'))
9
10 print(m.hexdigest()) #92a7e713c30abbb0319fa07da2a5c4af
11
12 m2=hashlib.md5()
13 m2.update('helloalvin'.encode('utf8'))
14 print(m2.hexdigest()) #92a7e713c30abbb0319fa07da2a5c4af
15
16 '''
17 注意:把一段很长的数据update多次,与一次update这段长数据,得到的结果一样
18 但是update多次为校验大文件提供了可能。
19 '''
以上加密算法虽然依然非常厉害,但时候存在缺陷,即:通过撞库可以反解。所以,有必要对加密算法中添加自定义key再来做加密。(密码加盐)
import hashlib
# ######## 256 ########
hash = hashlib.sha256('898oaFs09f'.encode('utf8'))
hash.update('alvin'.encode('utf8'))
print(hash.hexdigest())
#e79e68f070cdedcfe63eaf1a2e92c83b4cfb1b5c6bc452d214c1b7e77cdfd1c7

浙公网安备 33010602011771号