常用模块之json、pickle、hashlib

常用模块之json、pickle、hashlib
- 一 json&pickle模块
- 二 hashlib模块

常用模块之json、pickle、hashlib

一 json&pickle模块

1 什么是序列化

我们把对象(变量) 从内存中编程可存储或传输的过程，称之为序列化。在python中叫pickling，在其他语言中也称之为serialization，marshalling，flattening等等。

2 为何要序列化

2.1 持久保存状态。

将内存中的数据保存到文件中，下次程序执行可以从文件中载入之前的数据，就是序列化。

2.2 跨平台数据交互。

序列化之后的数据，可以通过网络传输，若有一种双方约定好的序列化格式，就可以实现跨平台数据交互。

3 如何序列化

3.1 json格式

如果我们要在不同的编程语言之间传递对象，就必须序列化为标准格式，json是一种很好的序列化格式，因为json表示出来就是一个字符串，可以被所有语言读取，可以方便网络传输。

json和python数据类型对比：

# JSON的基本使用
import json

dic={'name':'alvin','age':23,'sex':'male'}
print(type(dic))#<class 'dict'>
  
j=json.dumps(dic)
print(type(j))#<class 'str'>


f=open('序列化对象','w')
f.write(j)  #-------------------等价于json.dump(dic,f)
f.close()
#-----------------------------反序列化<br>
import json
f=open('序列化对象')
data=json.loads(f.read())#  等价于data=json.load(f)

# 使用的注意点：
import json
#dct="{'1':111}"#json 不认单引号
#dct=str({"1":111})#报错,因为生成的数据还是单引号:{'one': 1}

dct='{"1":"111"}'
print(json.loads(dct))

#conclusion:
#        无论数据是怎样创建的，只要满足json格式，就可以json.loads出来,不一定非要dumps的数据才能loads

# 其他需要了解的
# 在python解释器2.7与3.6之后都可以json.loads(bytes类型)，但唯独3.5不可以
>>> import json
>>> json.loads(b'{"a":111}')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/Users/linhaifeng/anaconda3/lib/python3.5/json/__init__.py", line 312, in loads
    s.__class__.__name__))
TypeError: the JSON object must be str, not 'bytes'

3.2 pickle格式

由于pickle格式支持python所有数据类型，且仅支持python语言，因此在python存档的时候，使用pickle格式最好。

# pickle的基本使用
import pickle

dic={'name':'alvin','age':23,'sex':'male'}
 
print(type(dic))#<class 'dict'>

j=pickle.dumps(dic)
print(type(j))#<class 'bytes'>

f=open('序列化对象_pickle','wb')#注意是w是写入str,wb是写入bytes,j是'bytes'
f.write(j)  #-------------------等价于pickle.dump(dic,f)
 
f.close()
#-------------------------反序列化
import pickle
f=open('序列化对象_pickle','rb')
 
data=pickle.loads(f.read())#  等价于data=pickle.load(f)

print(data['age'])

二 hashlib模块

1 什么叫hash

hash是一种算法(3.x里代替了md5模块和sha模块，主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ，MD5 算法) ，该算法接收传入的内容，经过运算得到一串hash值

2 hash值的三个特点

(1) 只要传入的内容一样，得到的hash值必然一样=====>要用明文传输密码文件完整性校验。

(2) 不可逆，不能由hash值反解成内容=======》把密码做成hash值，不应该在网络传输明文密码。

(3) 只要使用的hash算法不变，无论校验的内容有多大，得到的hash值长度是固定的。

3 如何使用hash

hash算法就像一座工厂，工厂接收你送来的原材料(可以用m.update()为工厂运送原材料) ，经过加工返回的产品就是hash值。

 1 import hashlib
 2  
 3 m=hashlib.md5()# m=hashlib.sha256()
 4  
 5 m.update('hello'.encode('utf8'))
 6 print(m.hexdigest())  #5d41402abc4b2a76b9719d911017c592
 7  
 8 m.update('alvin'.encode('utf8'))
 9  
10 print(m.hexdigest())  #92a7e713c30abbb0319fa07da2a5c4af
11  
12 m2=hashlib.md5()
13 m2.update('helloalvin'.encode('utf8'))
14 print(m2.hexdigest()) #92a7e713c30abbb0319fa07da2a5c4af
15 
16 '''
17 注意：把一段很长的数据update多次，与一次update这段长数据，得到的结果一样
18 但是update多次为校验大文件提供了可能。
19 '''

以上加密算法虽然依然非常厉害，但时候存在缺陷，即：通过撞库可以反解。所以，有必要对加密算法中添加自定义key再来做加密。(密码加盐)

import hashlib
 
# ######## 256 ########
 
hash = hashlib.sha256('898oaFs09f'.encode('utf8'))
hash.update('alvin'.encode('utf8'))
print(hash.hexdigest())
#e79e68f070cdedcfe63eaf1a2e92c83b4cfb1b5c6bc452d214c1b7e77cdfd1c7

posted @ 2020-03-18 20:36 越关山阅读(240) 评论(0) 收藏举报

刷新页面返回顶部

上士闻道

勤而行之

常用模块之json、pickle、hashlib

常用模块之json、pickle、hashlib

一 json&pickle模块

1 什么是序列化

2 为何要序列化

2.1 持久保存状态。

2.2 跨平台数据交互。

3 如何序列化

3.1 json格式

3.2 pickle格式

二 hashlib模块

1 什么叫hash

2 hash值的三个特点

3 如何使用hash

公告