常用模块之json、pickle、hashlib

常用模块之json、pickle、hashlib

一 json&pickle模块

1 什么是序列化

​ 我们把对象(变量) 从内存中编程可存储或传输的过程,称之为序列化。在python中叫pickling,在其他语言中也称之为serialization,marshalling,flattening等等。

2 为何要序列化

2.1 持久保存状态。

​ 将内存中的数据保存到文件中,下次程序执行可以从文件中载入之前的数据,就是序列化。

2.2 跨平台数据交互。

​ 序列化之后的数据,可以通过网络传输,若有一种双方约定好的序列化格式,就可以实现跨平台数据交互。

3 如何序列化

3.1 json格式

​ 如果我们要在不同的编程语言之间传递对象,就必须序列化为标准格式,json是一种很好的序列化格式,因为json表示出来就是一个字符串,可以被所有语言读取,可以方便网络传输。

json和python数据类型对比:

# JSON的基本使用
import json

dic={'name':'alvin','age':23,'sex':'male'}
print(type(dic))#<class 'dict'>
  
j=json.dumps(dic)
print(type(j))#<class 'str'>


f=open('序列化对象','w')
f.write(j)  #-------------------等价于json.dump(dic,f)
f.close()
#-----------------------------反序列化<br>
import json
f=open('序列化对象')
data=json.loads(f.read())#  等价于data=json.load(f)

# 使用的注意点:
import json
#dct="{'1':111}"#json 不认单引号
#dct=str({"1":111})#报错,因为生成的数据还是单引号:{'one': 1}

dct='{"1":"111"}'
print(json.loads(dct))

#conclusion:
#        无论数据是怎样创建的,只要满足json格式,就可以json.loads出来,不一定非要dumps的数据才能loads

# 其他需要了解的
# 在python解释器2.7与3.6之后都可以json.loads(bytes类型),但唯独3.5不可以
>>> import json
>>> json.loads(b'{"a":111}')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/Users/linhaifeng/anaconda3/lib/python3.5/json/__init__.py", line 312, in loads
    s.__class__.__name__))
TypeError: the JSON object must be str, not 'bytes'

3.2 pickle格式

​ 由于pickle格式支持python所有数据类型,且仅支持python语言,因此在python存档的时候,使用pickle格式最好。

# pickle的基本使用
import pickle

dic={'name':'alvin','age':23,'sex':'male'}
 
print(type(dic))#<class 'dict'>

j=pickle.dumps(dic)
print(type(j))#<class 'bytes'>

f=open('序列化对象_pickle','wb')#注意是w是写入str,wb是写入bytes,j是'bytes'
f.write(j)  #-------------------等价于pickle.dump(dic,f)
 
f.close()
#-------------------------反序列化
import pickle
f=open('序列化对象_pickle','rb')
 
data=pickle.loads(f.read())#  等价于data=pickle.load(f)

print(data['age'])  

二 hashlib模块

1 什么叫hash

​ hash是一种算法(3.x里代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,MD5 算法) ,该算法接收传入的内容,经过运算得到一串hash值

2 hash值的三个特点

(1) 只要传入的内容一样,得到的hash值必然一样=====>要用明文传输密码文件完整性校验。

(2) 不可逆,不能由hash值反解成内容=======》把密码做成hash值,不应该在网络传输明文密码。

(3) 只要使用的hash算法不变,无论校验的内容有多大,得到的hash值长度是固定的。

3 如何使用hash

​ hash算法就像一座工厂,工厂接收你送来的原材料(可以用m.update()为工厂运送原材料) ,经过加工返回的产品就是hash值。

 1 import hashlib
 2  
 3 m=hashlib.md5()# m=hashlib.sha256()
 4  
 5 m.update('hello'.encode('utf8'))
 6 print(m.hexdigest())  #5d41402abc4b2a76b9719d911017c592
 7  
 8 m.update('alvin'.encode('utf8'))
 9  
10 print(m.hexdigest())  #92a7e713c30abbb0319fa07da2a5c4af
11  
12 m2=hashlib.md5()
13 m2.update('helloalvin'.encode('utf8'))
14 print(m2.hexdigest()) #92a7e713c30abbb0319fa07da2a5c4af
15 
16 '''
17 注意:把一段很长的数据update多次,与一次update这段长数据,得到的结果一样
18 但是update多次为校验大文件提供了可能。
19 '''

​ 以上加密算法虽然依然非常厉害,但时候存在缺陷,即:通过撞库可以反解。所以,有必要对加密算法中添加自定义key再来做加密。(密码加盐)

import hashlib
 
# ######## 256 ########
 
hash = hashlib.sha256('898oaFs09f'.encode('utf8'))
hash.update('alvin'.encode('utf8'))
print(hash.hexdigest())
#e79e68f070cdedcfe63eaf1a2e92c83b4cfb1b5c6bc452d214c1b7e77cdfd1c7
posted @ 2020-03-18 20:36  越关山  阅读(227)  评论(0)    收藏  举报