python基础5 ---python文件处理

python文件处理

一、文件处理的流程

  1. 打开文件,得到文件句柄并赋值给一个变量
  2. 通过句柄对文件进行操作
  3. 关闭文件

二、文件的操作方法

  1、文件打开模式格式:

    文件句柄 = open('文件路径', '模式')

  注释:打开文件时,需要指定文件路径和以何等方式打开文件,打开后,即可获取该文件句柄,日后通过此文件句柄对该文件操作。

  2、文件打开模式:

     r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】

     w,只写模式【不可读;不存在则创建;存在则清空内容】

      x, 只写模式【不可读;不存在则创建,存在则报错】

     a, 追加模式【可读;   不存在则创建;存在则只追加内容】

     b"表示以字节的方式操作 :rb  或 r+b

                wb 或 w+b

                xb 或 w+b

                ab 或 a+b

    补充:r、w、a为打开文件的基本模式,对应着只读、只写、追加模式;b、t、+、U这四个字符,与以上的文件打开模式组合使用,二进制模式,文本模式,读写模式、     通用换行符,根据实际情况组合使用、

  3、文件内置函数flush

    flush原理: 文件操作是通过软件将文件从硬盘读到内存 ,写入文件的操作也都是存入内存缓冲区buffer(内存速度快于硬盘,如果写入文件的数据都从内存刷到硬盘,内存与硬盘的速度延迟会被无限放大,效率变低,所以要刷到硬盘的数据我们统一往内存的一小块空间即buffer中放,一段时间后操作系统会将buffer中数据一次性刷到硬盘).flush的作用是强制将写入的数据刷到硬盘。

  4、open函数详解

    open()语法
         格式:open(file[, mode[, buffering[, encoding[, errors[, newline[, closefd=True]]]]]])

    open函数有很多的参数,常用的是file,mode和encoding
    file文件位置,需要加引号
    mode文件打开模式
    buffering的可取值有0,1,>1三个,0代表buffer关闭(只适用于二进制模式),1代表line buffer(只适用于文本模式),>1表示初始化的buffer大小;
    encoding表示的是返回的数据采用何种编码,一般采用utf8或者gbk;
    errors的取值一般有strict,ignore,当取strict的时候,字符编码出现问题的时候,会报错,当取ignore的时候,编码出现问题,程序会忽略而过,继续执行下面的程序。
    newline可以取的值有None, \n, \r, ”, ‘\r\n',用于区分换行符,但是这个参数只对文本模式有效;
    closefd的取值,是与传入的文件参数有关,默认情况下为True,传入的file参数为文件的文件名,取值为False的时候,file只能是文件描述符,什么是文件描述符,就是一个非负整数,在Unix内核的系统中,打开一个文件,便会返回一个文件描述符。

   5、文件操作参数

   .read([size])         #size为读取的长度,以byte为单位

 

   .readline([size])       #读一行,如果定义了size,有可能返回的只是一行的一部分

 

   .readlines([size])       #把文件每一行作为一个list的一个成员,并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数,size是表示读取内容的总长,也就是说可能只读到文件的一部分。

 

   .write(str)          #把str写到文件中,write()并不会在str后加上一个换行符

 

   .writelines(seq)        #把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入,不会在每行后面加上任何东西。

 

   .close()            #关闭文件。python会在一个文件不用后自动关闭文件,不过这一功能没有保证,最好还是养成自己关闭的习惯。  如果一个文件在关闭后还对其进行操作会产生ValueError

 

   .flush()            #把缓冲区的内容写入硬盘

 

   .isatty()            #文件是否是一个终端设备文件(unix系统中的)

 

   .tell()             #返回文件操作标记的当前位置,以文件的开头为原点

 

   .next()                #返回下一行,并将文件操作标记位移到下一行。把一个file用于for … in file这样的语句时,就是调用next()函数来实现遍历的。

 

   .seek(offset[,whence])#将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。

   .truncate([size])        #把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去

   6、上下文管理实例。

with open('a.txt','w') as f:
    pass
with open('a.txt','r') as read_f,open('b.txt','w') as write_f:
    data=read_f.read()
    write_f.write(data)
posted @ 2017-06-13 18:45  mx轩  阅读(213)  评论(0编辑  收藏  举报