编写自定义类实现json和pickle文件的多行写入,多行读取

  • json与pickle

    • 序列化(serialization):将内存中的结构化数据转换成字节串。
    • 反序列化(deserialization):从文件中或网络中获取的数据转换成内存中原来的数据类型
    • 具体方法:dump、dumps、load、loads
      • dump与load是对文件进行操作(序列化与反序列化)
      • dumps与loads时对内存中的数据进行操作(序列化与反序列化)
  • pickle 写入多个对象,读取多个对象

    pickle支持多次dump,但对于读取文件,我们再不清楚内容(load多少次)时,使用try except EOFError
    
    class A:
        def __init__(self):
            self.li = []
    class B:
        def __init__(self):
            self.li = []
    a = A()
    a.li.append(1)
    b = B()
    b.li.append(2)
    
    import pickle
    class My_pickle():
        def __init__(self,path):
            self.path = path
        def dump(self,*args):
            with open(self.path,mode='wb') as f:
                for i in args:
                    pickle.dump(i,f)
        def load(self):
            with open(self.path,mode='rb') as f:
                while 1:
                    try:
                        yield pickle.load(f)
                    except EOFError:
                        break
                 
    p1 = My_pickle('test.pikle')
    p1.dump(a,b)
    for i in p1.load():
        print(i)
    
  • json写入多行

    方式一: 
    将待写入的多种数据(列表,元组,字典)放到一个列表中写入,读取时,将列表反序列化到内存,在逐个返回。
    缺点:一次性取出所有,内存占用大。
    import json
    class My_json():
        def __init__(self,file):
            self.file = file
        def dump(self,*args):
            with open(self.file,mode='w',encoding='utf-8') as f:
                li = []
                for i in args:
                    li.append(i)
                json.dump(li,f)
    
        def load(self):
            with open(self.file,mode='r',encoding='utf-8') as f:
                ret = json.load(f)
                for j in ret:
                    yield j
    j = My_json('test.json')
    j.dump([1,2,3,4,],'ssss')
    for i in j.load():
        print(i)
    
    方式二:   推荐
        将待写入的多种数据(列表,元组,字典)写入一种数据的同时写入一个\n,这样读取文件的时候,使用for遍历文件句柄,对于得到的字符串使用json.loads()方法进行反序列化。
    import json
    class My_json():
        def __init__(self,file):
            self.file = file
        def dump(self,*args):
            with open(self.file,mode='w',encoding='utf-8') as f:
                for i in args:
                    json.dump(i,f)
                    f.write('\n')
        def load(self):
            with open(self.file,encoding='utf-8') as f:
                for line in f:
                    ret = json.loads(line)
                    print(ret)
    j = My_json('test.json')
    j.dump([1,2,3,4,],'ssss')
    j.load()
    
    方式三:   
       	在方式二的基础上进行的小改,除了先dump(i)在write('\n'),我们还可以先用 dumps(i)序列化数据,然后再write(序列化数据 + '\n')
    import json
    class My_json():
        def __init__(self,file):
            self.file = file
        def dump(self,*args):
            with open(self.file,mode='w',encoding='utf-8') as f:
                for i in args:                
                    f.write(json.dumps(i) + '\n')
        def load(self):
            with open(self.file,encoding='utf-8') as f:
                for line in f:
                    ret = json.loads(line)
                    print(ret)
    j = My_json('test.json')
    j.dump([1,2,3,4,],'ssss')
    j.load()
    
  • pickle和json在对多行写入,写出的区别:

    • pickle 支持多次dump,所以对应着就可以多次load来取这个数据,但当我们不知道文件中有多少个或者不知道该load几次的时候,我们可以使用try except EOFError 来让它停止。
    • json 不支持多次dump,所以在dump一次后,在写入一个换行。 这样在读文件的时候,我们循环遍历文件句柄,读一行,用loads (注意这里的loads是因为,已经对内存的字符串进行处理/而不是文件)
posted @ 2019-06-03 16:33  chennq  阅读(685)  评论(0编辑  收藏  举报