python文件处理
r模式:
r只读模式:在文件不存在时报错,文件存在文件内指针直接跳到文件开头
with open('db.txt',mode='r',encoding='utf-8') as f: res=f.read() #会将文件的内容由硬盘全部读入内存,赋值给res print(res)
inp_name=input('请输入你的名字:').strip() inp_pwd=input('请输入你的密码:').strip() with open(r'db.txt',mode='r',encoding='utf-8') as f: for line in f: u,p=line.strip('\n').strip(':') if inp_name == u and inp_pwd == p: print ('登录成功') break else: print ('账号密码错误')
w模式:
w只写模式:在文件不存在时会创建空文档,文件存在会清空文件,文件指针跑到文件开头
with open('b.txt',mode='w',encoding='utf-8') as f: f.write('你好\n') f.write('我好\n') f.write('大家好\n') f.write('111\n222\n333\n') #强调: #1.在文件不关闭的情况下,连续的写入,后写的内容一定跟在前写内容的后面 #2.如果重新以w模式打开文件,则会清空文件内容
a模式:
a只追加写模式:在文件不存在时会创建空文档,文件存在会将指针直接移动到文件末尾
with open('b.txt',mode='a',encoding='utf-8') as f: f.write('你好\n') f.write('我好\n') f.write('大家好\n') f.write('111\n222\n333\n') #强调w模式与a模式的异同: #1.相同点:在打开的文件不关闭的情况下,连续的写入,新写的内容总会跟在前写的内容之后 #2.不同点:以a模式重新打开文件,不会清空源文件内容,会将文件指针直接移动到文件末尾,新写的永远写在最后
#注册 name=input('username>>>').strip() pwd=input('password>>>').strip() with open ('db.txt',mode='a',encoding='utf-8') as f: info='%s:%s\n' %(name,pwd) f.write(info)
控制文件读写内容的模式:
大前提:tb模式均不能单独使用,必须与r/w/a之一结合使用
t(默认的):文本模式
1.读写文件都是以字符为单位的
2.只能针对文本文件
3.必须指定encoding参数
#t模式:如果我们指定的文件打开模式为r/w/a,其实就是默认的rt/wt/at/ with open ('b.txt',mode='rt',encoding='utf-8') as f: res=f.read() print(type(res))#输出结果为:<class 'str'> with open('b.txt',mode='wt',encoding='utf-8') as f: s='abc' f.write(s)#写入的也必须是字符串类型 #强调:t模式只能用于操作文本文件,无论读写,都应该以字符串为单位,而存取硬盘本质都是二进制的形式,当指定t模式时,内部帮我们做了编码与解码
input_user=input('user:') input_password=input('password:') with open('db.txt',mode='rt',encoding='utf-8') as f: res=f.read() user,password=res.split(':') if input_user == user and input_password == password: input('success') else: input('error')
#账户密码验证 input_username=input('username>>>') input_password=input('password>>>') with open('db.txt',mode='rt',encoding='utf-8') as f: for line in f: username,password=line.strip().split(':') if input_username==username and input_password==password: print('login success!') break else: print('username or password error!')
#文件内容复制 with open('db.txt',mode='rt',encoding='utf-8') as f,\ open('db1.txt',mode='wt',encoding='utf-8') as f1: res=f.read() f1.write(res)
#复制文件路径 src_file=input('源文件路径>>>').strip() dst_file=input('目标文件路径').strip() with open(r'{}'.format(src_file),mode='rt',encoding='utf-8') as f,\ open(r'{}'.format(dst_file),mode='wt',encoding='utf-8') as f1: res=f.read() f1.write(res)
x模式:只写模式(不可读,不存在则创建,存在则报错)
b模式:二进制模式(binary模式)
1.读写文件都是以bytes/二进制为单位的
2.可以针对所有文件
3.一定不能指定encoding参数
#b:读写都是以二进制为单位 with open('db.txt',mode='rb') as f: data=f.read() print(type(data))#输出结果为<class 'bytes'> with open('b.txt',mode='wb') as f: msg='你好' res=msg.encode('utf-8')#res为bytes类型 f.write(res)#在b模式下写入文件的只能是bytes类型
强调:b模式对比t模式
1.在操作纯文本文件方面t模式帮我们省去了编码与解码的环节,b模式则需要手动编码与解码,所以此时t模式更为方便
2.针对非文本文件(如图片、视频、音频等)只能使用b模式
readline:一次读一行
with open('db.txt',mode='rt',encoding='utf-8') as f: while True: line=f.readline() if len(line) == 0: break print(line)
readlines:一次读取多行,成列表
with open('db.txt',mode='rt',encoding='utf-8') as f: res=f.readlines() print(res)
#1.如果是纯英文字符,可以直接加前缀b得到bytes类型 l=[ b'11dsadsa\n' b'jhkjh\n' b'jhijmsad' ] #2.'上'.encode('utf-8')等同于bytes('上',encoding='utf-8') #3.flush将写的东西马上刷入硬盘
with open('db.txt',mode='rt',encoding='utf-8') as f: print(f.readable())#是否可读 True print(f.writable())#是否可写 False print(f.encoding)#解码类型 utf-8 print(f.name)#名称 db.txt print(f.closed)#文件是否关闭 True
# 读操作 f.read() # 读取所有内容,执行完该操作后,文件指针会移动到文件末尾 f.readline() # 读取一行内容,光标移动到第二行首部 f.readlines() # 读取每一行内容,存放于列表中 # 强调: # f.read()与f.readlines()都是将内容一次性读入内容,如果内容过大会导致内存溢出,若还想将内容全读入内存,则必须分多次读入,有两种实现方式: # 方式一 with open('a.txt',mode='rt',encoding='utf-8') as f: for line in f: print(line) # 同一时刻只读入一行内容到内存中 # 方式二 with open('1.mp4',mode='rb') as f: while True: data=f.read(1024) # 同一时刻只读入1024个Bytes到内存中 if len(data) == 0: break print(data) # 写操作 f.write('1111\n222\n') # 针对文本模式的写,需要自己写换行符 f.write('1111\n222\n'.encode('utf-8')) # 针对b模式的写,需要自己写换行符 f.writelines(['333\n','444\n']) # 文件模式 f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式
f.readable() # 文件是否可读 f.writable() # 文件是否可读 f.closed # 文件是否关闭 f.encoding # 如果文件打开模式为b,则没有该属性 f.flush() # 立刻将文件内容从内存刷到硬盘 f.name
主动控制文件内指针移动
#大前提:文件内指针的移动都是Bytes为单位的,唯一例外的是t模式下的read(n),n以字符为单位 with open('a.txt',mode='rt',encoding='utf-8') as f: data=f.read(3) # 读取3个字符 with open('a.txt',mode='rb') as f: data=f.read(3) # 读取3个Bytes # 之前文件内指针的移动都是由读/写操作而被动触发的,若想读取文件某一特定位置的数据,则则需要用f.seek方法主动控制文件内指针的移动,详细用法如下: # f.seek(指针移动的字节数,模式控制): # 模式控制: # 0: 默认的模式,该模式代表指针移动的字节数是以文件开头为参照的 # 1: 该模式代表指针移动的字节数是以当前所在的位置为参照的 # 2: 该模式代表指针移动的字节数是以文件末尾的位置为参照的 # 强调:其中0模式可以在t或者b模式使用,而1跟2模式只能在b模式下用
0模式
# a.txt用utf-8编码,内容如下(abc各占1个字节,中文“你好”各占3个字节) abc你好 # 0模式的使用 with open('a.txt',mode='rt',encoding='utf-8') as f: f.seek(3,0) # 参照文件开头移动了3个字节 print(f.tell()) # 查看当前文件指针距离文件开头的位置,输出结果为3 print(f.read()) # 从第3个字节的位置读到文件末尾,输出结果为:你好 # 注意:由于在t模式下,会将读取的内容自动解码,所以必须保证读取的内容是一个完整中文数据,否则解码失败 with open('a.txt',mode='rb') as f: f.seek(6,0) print(f.read().decode('utf-8')) #输出结果为: 好
1模式
with open('a.txt',mode='rb') as f: f.seek(3,1) # 从当前位置往后移动3个字节,而此时的当前位置就是文件开头 print(f.tell()) # 输出结果为:3 f.seek(4,1) # 从当前位置往后移动4个字节,而此时的当前位置为3 print(f.tell()) # 输出结果为:7
2模式
# a.txt用utf-8编码,内容如下(abc各占1个字节,中文“你好”各占3个字节) abc你好 # 2模式的使用 with open('a.txt',mode='rb') as f: f.seek(0,2) # 参照文件末尾移动0个字节, 即直接跳到文件末尾 print(f.tell()) # 输出结果为:9 f.seek(-3,2) # 参照文件末尾往前移动了3个字节 print(f.read().decode('utf-8')) # 输出结果为:好 # 小练习:实现动态查看最新一条日志的效果 import time with open('access.log',mode='rb') as f: f.seek(0,2) while True: line=f.readline() if len(line) == 0: # 没有内容 time.sleep(0.5) else: print(line.decode('utf-8'),end='')

浙公网安备 33010602011771号