第六篇 文本操作和管理上下文

 

一、打开文件

文件句柄 = open(file, mode='r', buffering=-1, encoding=None)

打开文件时,需要指定文件路径和以何等方式打开文件,打开后,即可获取该文件句柄,日后通过此文件句柄对该文件操作。

打开文件的模式有:

  • r ,只读模式【默认】
  • w,只写模式【不可读;不存在则创建;存在则清空内容;】
  • x, 只写模式【不可读;不存在则创建,存在则报错】
  • a, 追加模式【可读;   不存在则创建;存在则只追加内容;】

"+" 表示可以同时读写某个文件

  • r+, 读写【可读,可写】
  • w+,写读【可读,可写】
  • x+ ,写读【可读,可写】
  • a+, 写读【可读,可写】

 "b"表示以字节的方式操作

  • rb  或 r+b
  • wb 或 w+b
  • xb 或 w+b
  • ab 或 a+b

 注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,当以二进制的方式的效率比较高,因为磁盘底层是以字节存储

二、操作

对于文件也是个迭代对象,所以循环遍历文件的每一行用的非常多

f = open('/etc/passwd','r')
for line in f:
    print(line)
 
f.close()        关闭文件
f.fileno()      返回文件描述符
f.readline()     从当前指针读取一行
f.readlines()    从当前指针读取到结尾的全部行
f.read()         从当前指针读多少个字节,没有参数读取全部
f.tell()         告诉当前指针,是字节
f.seek(offset [whence])    移动指针,f.seek(0)把指针移动第一行第0个字节位置
    offset: 偏移量
    whence: 位置
        0: 从文件头
        1:从当前位置
        2:从文件尾部
    
f.write(string)    打开文件时,文件不存在,r,r+都会报错,其他模式则不会
f.writelines()     必须是字符串序列,把字符串序列当作一个列表写进文件
f.flush()          在文件没有关闭时,可以将内存中的数据刷写至磁盘
f.truncate()       文件截取多少字节保留,指针后面的内容全部会清空

f.name             是返回文件名字,不是方法,是属性    
f.closed           判断文件是否已经关闭
f.encoding         查看编码格式,没有使用任何编码,则为None
f.mode             打开文件的模式
f.newlines         显示出换行符的,空为默认\n不显示
 

一些例子:

 
#打开模式没有b则打开的字符串
f  = open('db','r')
data = f.read()
print(data,type(data))
f.close()

#打开模式有b则打开的时字节
f1  = open('db','rb')
data = f.read()
print(data,type(data))
f.close()

# 打开模式有w和b则写入的字符串需要转换成字节
f2  = open('db','ab')
f.write(bytes("hello",encoding="utf-8"))
f.close()

f3 = open('db','a+',encoding="utf-8") # 如果打开模式无b,则read,按照字符读取 data = f3.read(1) # tell当前指针所在的位置(字节) print(f3.tell()) # 调整当前指针你的位置(字节),写的话会覆盖原来的 f3.seek(f3.tell()) f3.write("777") f3.close()
 

 

三、管理上下文

为了避免打开文件后忘记关闭,可以通过管理上下文,即:

with open('log','r') as f:        
    ...

如此方式,当with代码块执行完毕时,内部会自动关闭并释放文件资源。

在Python 2.7 及以后,with又支持同时对多个文件的上下文进行管理,即:

(1)读取一个文件中的10行写入另外一个文件中

 
with open('db1','r',encoding="utf-8") as f1,open('db2','w',encoding="utf-8") as f2:
    times = 0
    for line in f1:
        times += 1
        if times <= 10:
            f2.write(line)
        else:
            break
 

(2)将一个文件一行一行读取并批量替换并写入另外一个文件

with open('db1','r',encoding="utf-8") as f1,open('db2','w',encoding="utf-8") as f2:
    for line in f1:
        new_str = line.replace('ales','st')
        f2.write(new_str)

(3)假设现在有这样一个需求,有一个10G大的文件,如何拷贝到另一个文件中去?下面将讲一下如何同时打开两个文件进行处理,以及文件太大的时候如何读取用with语句就可以同时打开两个文件,一个读,一个写。假设1.txt文件有10G大,如果用read则一次性就将内容读到内存中去了,这显然不合适,如果用readline()的话虽然也可以读一行,但是并不知道何时结束,但是可以用for循环读取文件这个可迭代的对象,一行行的读取。下面三行代码就可以实现了

with open('1.txt','r',encoding='utf-8') as fread,open('2.txt','w') as fwrite:
    for line in fread:          #一行行的读
        fwrite.write(line)        #一行行的写

 

文件系统功能:import os
目录相关:
os.getcwd() 返回当前工作目录
os.chdir() 切换目录
os.chroot() 设定当前进程的根目录
os.listdir() 列出指定目录下的所有文件名
os.mkdir() 创建指定目录
os.makedirs() 创建多级目录
os.rmdir() 删除陌路
os.removedirs() 删除多级目录

文件相关:
os.mkfifo() 创建管道文件
os.mknod() 创建设备文件
os.remove() 删除文件

os.rename() 文件重命名
os.stat() 查看文件的状态属性

os.symlink() 创建链接文件
os.unlink() 删除链接文件

os.utime() 更新文件时间戳
os.tmpfile() 创建并打开(w+b)一个新的
os.walk() 生成目录结构的生成器

访问权限:
os.access() 检验文件某个用户是否有访问权限
os.chmod() 修改权限
os.chown() 修改属主属组
os.umask() 设置默认权限模式

文件描述符:
os.open() 根据文件描述打开
os.read() 根据文件描述读
os.write() 根据文件描述符写

创建设备:
os.mkdev() 创建设备文件
os.major() 获取设备主版本号
os.minor() 获取设备次版本号


用户相关:
os.getuid() 获取当前用户的uid
os.getgid() 获取当前用户的gid


文件路径:
os.path.basename() 路径基名
os.path.dirname() 路径目录名
os.path.join() 将dirname()和basename()连接起来
os.path.split() 返回dirname(),basename()元组
os.path.splitext() 返回(filename,extension)元组

os.path.getatime()
os.path.getctime()
os.path.getmtime()
os.path.getsize() 返回文件的大小

os.path.exists() 判断指定文件是否存在
os.path.isabs() 判断指定的路径是否为绝对路径
os.path.isdir() 判断是否为目录
os.path.isfile() 判断是否为文件
os.path.islink() 判断是否为链接文件
os.path.ismount() 判断是否为挂载点
os.path.samefile() 判断两个路径是否指向了同一个文件

对象持久存储:
  pickle模块
  marshal
  
DMB接口
shelve模块


pickle.dump()
pickle.load()

 
示例:
>>> dir1 = os.path.dirname('/etc/sysconfig/network-scripts')

>>> file1 = os.path.basename('/etc/sysconfig/network-scripts')

>>> print(dir1,file1)
/etc/sysconfig network-scripts

>>> os.path.join(dir1,file1)
'/etc/sysconfig/network-scripts'


示例:
>>> for filename in os.listdir('/tmp'):
        print(os.path.join('/tmp',filename))


示例:判断文件是否存在,存在则打开
让用户通过键盘反复输入多行数据
追加保存至此文件中

#!/usr/bin/env python27

import os
import os.path

filename = '/tmp/test2.txt'

if os.path.isfile(filename):
    f1 = open(filename,'a+')

while True:
    line = raw_input('Enter somethin> ')
    if line == 'q' or line == 'quit':
        break
    f1.write(line+'\n')

f1.close()


示例:将字典写入文件中,并还原
>>> import pickle
>>> d1 = {'x':123,'y':567,'z':'hello world'}
>>> f5 = open('/tmp/dfile.txt','a+')
>>> pickle.dump(d1,f5)
>>> f5.flush()
>>> f5.close()


>>> f6 = open('/tmp/dfile.txt','r')
>>> d2 = pickle.load(f6)
>>> print(d2)
{'y': 567, 'x': 123, 'z': 'hello world'}
 

 

posted @ 2017-03-05 20:58  pyrene  阅读(205)  评论(0编辑  收藏  举报