day 08 字符编码和文件的读写操作

Posted on 2019-01-07 19:51  九块九  阅读(126)  评论(0)    收藏  举报

打开文件的语法

f=open("test.txt",encoding=:"utf-8") #给系统发送一个指令,让操作系统去打开文件

使用上面的方法打开文件的方式,一定要记得手动的close()文件,否则会一直占用系统的资源

f.close()

打开文件的语法2..在with代码类的执行完毕退出后,会自动调用close(),这是python解释器,为我们提供的方法的方式

with open("test.txt",encoding="utf-8") as f:
  data= f.read()

读取文件

open的三个参数的简介:
参数1:需要打开的文件的路径  可以是绝对路径 也可以是相对路径

参数2: mode 打开文件的模式

参数3encoding 在我的理解,就是读取的文件 是以什么编码存入硬盘的,这里就写什么编码

中文的windows默认是gbk编码,linux默认是utf-8编码

f=open("test.txt","r",encoding="utf-8")

data=f.read()

read()函数可以指定读取文件的大小,如果打开方式是rt模式,则指定的大小为读取的字符数量

        如果打开方式是rb模式,则指定的大小为读取的字节数

  :函数有默认值,如果不给定函数一个值,则使用默认值,( -1 )读取文件的全部内容到内容中

f.readable()  #判断 该返回的文件描述符是否可读

f.writeable() #判断, 该返回的文件描述符是否可写

f.readline() #只会读取一行,如果需要文件的全部内容,需要循环读取文件的内容

f.readlines()  #读取文件的所有内容,放到一个列表当中

写入文件

with oepn("test.txt","w",encoding="utf-8") as f:

  f.write(msg)  #将msg写入文件当中

"w"  模式打开的时候,先将文件清空,然后才会将文件写入

 

对非文本文件的读写

在操作非文本文件是,必须明确指定模式为字节模块

 b  用来指定为字节模式

注意:

b必须与 r\w模式连用, rb(readbytes)\wb

当模式为字节模式时 不能指定encoding参数

默认情况下是读写文本模式, 也就是t模式,需要将r\w连用

t 模式因为是文本读取模式, 所以python解释器会自动进行编码和解码但是b模式不会

#在b模式只能写入字节

with open("test.txt","wb") as f:

  f.write("abs".encode("utf-8"))

  f.write("你好".encode("utf-8"))

因为b模式只能写入字节,所以再将字符串存入非文本文件的时候,必须将字符串编码成字节模式

a:追加模式,文件指针直接跳到文件的末尾,不会清空文件的内容然后将内容写入

+表示可读可写模式,必须和r\w\a联用,不能单独使用"+"

w+:清空源文件,如果不存在则创建

r+:文件如果不存在,则报错

a+:如果不存在则创建,光标移动到文件的末尾,

 

文件编码的终极奥义:

就是读取文件的编码必须和文件存入硬盘时的编码相同

造成python2中文乱码的原因:

因为在Python2的解释器的原因,那个时候没有unicode,所以代码在读入内存的时候,头文件采取的什么编码方式

解释器在将python的代码当做普通的文本内容读入内存的时候就采用什么编码方式,当解释器在解释python代码的时候

则直接将 文本 的二进制内容,直接放入内存里面,所以再往外输出的时候,如果默认的编码方式,与python代码存入内存

时候的代码不相同,则就会乱码,所以再定义变量的 时候在前面加一个u,则编码的时候采用unicode编码方式(万国码),所以

在读取的时候就不会报错

encoding()  编码

decoding()  解码