Python之pickle

Pickle模块可以序列化对象并保存到磁盘中,并在需要的时候读取出来,任何对象都可以执行序列化操作。在机器学习中,我们常常需要把训练好的模型存储起来,这样在进行决策时直接将模型独处,而不需要重新训练模型,这样就大大节约了时间。
python3官方文档:https://docs.python.org/3.5/library/pickle.html

pickle模块常用函数

dump(obj,file,[,protocol]) 将obj对象序列化存入已经打开的file中
load(file) 将file中的对象序列化读出
dumps(obj,[,protocol]) 将obj对象序列化为string形式,而不是存入文件中
loads(string) 从string中读出序列化前的obj对象

示例

#coding=utf-8

import pickle

datalist = [[1, 1, 'yes'],  
           [1, 1, 'yes'],  
           [1, 0, 'no'],  
           [0, 1, 'no'],  
           [0, 1, 'no']]  
           
datadict = { 0: [1, 2, 3, 4],  
            1: ('a', 'b'),  
            2: {'c':'yes','d':'no'}}  

with open("pickle_test.txt","wb") as writefp:
    pickle.dump(datalist, writefp)
    pickle.dump(datadict, writefp)
  
with open("pickle_test.txt", "rb") as readfp:
    data1 = pickle.load(readfp)
    data2 = pickle.load(readfp)
    print (data1)
    print (data2)

p = pickle.dumps(datalist)  
print( pickle.loads(p) )  
p = pickle.dumps(datadict)  
print( pickle.loads(p) ) 

  >>> [[1, 1, 'yes'], [1, 1, 'yes'], [1, 0, 'no'], [0, 1, 'no'], [0, 1, 'no']]
  >>> {0: [1, 2, 3, 4], 1: ('a', 'b'), 2: {'c': 'yes', 'd': 'no'}}
  >>> [[1, 1, 'yes'], [1, 1, 'yes'], [1, 0, 'no'], [0, 1, 'no'], [0, 1, 'no']]
  >>> {0: [1, 2, 3, 4], 1: ('a', 'b'), 2: {'c': 'yes', 'd': 'no'}}

  dump和load相比dumps和loads还有另外一种能力:dump()函数能一个接着一个的将几个对象序列化存储到同一个文件中,随后调用load()来以同样的顺序反序列化读出这些对象
posted @ 2018-03-03 15:14  Fate0729  阅读(225)  评论(0编辑  收藏  举报