𝓝𝓮𝓶𝓸&博客

【Python】文件操作

文件操作

一. 文件操作的作用

思考:什么是文件?

思考:文件操作包含什么?
答:打开、关闭、读、写、复制....

思考:文件操作的的作用是什么?
答:读取内容、写入内容、备份内容......

总结:文件操作的作用就是把一些内容(数据)存储存放起来,可以让程序下一次执行的时候直接使用,而不必重新制作一份,省时省⼒。

二. 文件的基本操作

2.1 文件操作步骤

  1. 打开文件
  2. 读写等操作
  3. 关闭文件

注意:可以只打开和关闭文件,不进行任何读写操作。

也可以使用with命令包裹文件操作,当代码块内的代码执行完毕后会自动执行close关闭命令。

with open('./test_runoob.txt', 'w') as file:
  file.write('hello world !')

2.1.1 打开

在python,使用open函数,可以打开一个已经存在的文件,或者创建一个新文件,语法如下:

open(name, mode)

name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)。
mode:设置打开文件的模式(访问模式):只读、写入、追加等。

2.1.1.1 打开文件模式

模式 描述
r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。
r+ 打开一个文件用于读写。文件指针将会放在文件的开头。(覆盖写入
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
w 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
w+ 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。(打开存在的文件会先清空原有文件,所以读出来的是空的)
wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+ 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。(追加写入,指针在最后一行,所以读出来是空的)
ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

2.1.1.2 快速体验

f = open('test.txt', 'w')

注意:此时的 f 是 open 函数的文件对象。

2.1.2 文件对象方法

2.1.2.1 写

语法

文件对象.write('内容')

体验

# 1. 打开文件
f = open('test.txt', 'w')
# 2.文件写入
f.write('hello world')
# 3. 关闭文件
f.close()

注意:

  1. w 和 a 模式:如果文件不存在则创建该文件;如果文件存在, w 模式先清空再写入, a 模式直接末尾追加。
  2. r 模式:如果文件不存在则报错。

2.1.2.2 读

read()

文件对象.read(num)

num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。

readlines()
readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素。

f = open('test.txt')
content = f.readlines()

# ['hello world\n', 'abcdefg\n', 'aaa\n', 'bbb\n', 'ccc']
print(content)

# 关闭文件
f.close()

readline()
readline()一次读取一行内容。

f = open('test.txt')

content = f.readline()
print(f'第一行:{content}')

content = f.readline()
print(f'第二行:{content}')

# 关闭文件
f.close()

2.1.2.3 seek()

作用:用来移动文件指针。

语法如下:

文件对象.seek(偏移量, 起始位置)

起始位置:
0:文件开头
1:当前位置
2:文件结尾

2.1.3 关闭

文件对象.close()

三. 文件备份

需求:用户输入当前目录下任意文件名,程序完成对该文件的备份功能(备份文件名为xx[备份]后缀,例如:test[备份].txt)。

3.1 步骤

  1. 接收用户输入的文件名
  2. 规划备份文件名
  3. 备份文件写入数据

3.2 代码实现

  1. 接收用户输入目标文件名

    old_name = input('请输入您要备份的文件名:')
    
  2. 规划备份文件名

    1. 提取目标文件后缀
    2. 组织备份的文件名,xx[备份]后缀
    # 2.1 提取文件后缀点的下标
    index = old_name.rfind('.')
    
    # print(index) # 后缀中.的下标
    
    # print(old_name[:index]) # 源文件名(无后缀)
    
    # 2.2 组织新文件名 旧文件名 + [备份] + 后缀
    new_name = old_name[:index] + '[备份]' +old_name[index:]
    
    # 打印新文件名(带后缀)
    # print(new_name)
    
  3. 备份文件写入数据

    1. 打开源文件 和 备份文件
    2. 将源文件数据写入备份文件
    3. 关闭文件
    # 3.1 打开文件
    old_f = open(old_name, 'rb')
    new_f = open(new_name, 'wb')
    
    # 3.2 将源文件数据写入备份文件
    while True:
        con = old_f.read(1024)
        if len(con) == 0:
            break 
        
        new_f.write(con)
    
    # 3.3 关闭文件
    old_f.close()
    new_f.close()
    

3.3 思考

如果用户输入 .txt ,这是一个无效文件,程序如何更改才能限制只有有效的文件名才能备份?
答:添加条件判断即可。

old_name = input('请输入您要备份的文件名:')

index = old_name.rfind('.')

if index > 0:
    postfix = old_name[index:]

new_name = old_name[:index] + '[备份]' + postfix

old_f = open(old_name, 'rb')
new_f = open(new_name, 'wb')

while True:
    con = old_f.read(1024)
    if len(con) == 0:
        break
    new_f.write(con)

old_f.close()
new_f.close()

四. 文件和文件夹的操作

在Python中文件和文件夹的操作要借助os模块里面的相关功能,具体步骤如下:

  1. 导入os模块

    import os
    
  2. 使用 os 模块相关功能

    os.函数名()
    

4.1 文件重命名

os.rename(⽬标⽂件名, 新⽂件名)

4.2 删除文件

os.remove(⽬标⽂件名)

4.3 创建文件夹

os.mkdir(⽂件夹名字)

4.4 删除文件夹

os.rmdir(⽂件夹名字)

4.5 获取当前目录

os.getcwd()

4.6 改变默认目录

os.chdir(⽬录)

4.7 获取目录列表

os.listdir(⽬录)

五.应用案例

需求:批量修改文件名,既可添加指定字符串,又能删除指定字符串。

步骤

  1. 设置添加删除字符串的的标识
  2. 获取指定目录的所有文件
  3. 将原有文件名添加/删除指定字符串,构造新名字
  4. os.rename()重命名

代码

import os

# 设置重命名标识:如果为1则添加指定字符,flag取值为2则删除指定字符
flag = 1

# 获取指定目录
dir_name = './'

# 获取指定目录的文件列表
file_list = os.listdir(dir_name)
# print(file_list)

# 遍历文件列表内的文件
for name in file_list:
    # 添加指定字符
    if flag == 1:
        new_name = 'Python-' + name
    # 删除指定字符
    elif flag == 2:
        num = len('Python-')
        new_name = name[num:]
    # 打印新文件名,测试程序正确性
    print(new_name)
    
    # 重命名
    os.rename(dir_name+name, dir_name+new_name)

实例

在Python中,文件对象本身就是一个迭代器,我们可以直接使用for循环来遍历文件对象,逐行获取数据。

with open(r'temp.md', 'r', encoding='utf-8') as inputFile, \
    open(r'temp.md', 'r+', encoding='utf-8') as outputFile:
    
    for line in inputFile:

注意:这里的encoding需要指定一下,默认为gbk

在同一文件中,读取一行,处理一行,写入一行

with open(r'temp.md', 'r', encoding='utf-8') as inputFile, \
    open(r'temp.md', 'r+', encoding='utf-8') as outputFile:

    for line in inputFile:
        line = re.sub(r'^(```)$', r'\1python', line)
        outputFile.write(line)
        print(line)

在同一文件中,读取正则表达式,并且非贪婪替换

with open(r'temp.md', 'r', encoding='utf-8') as inputFile, \
    open(r'temp.md', 'r+', encoding='utf-8') as outputFile:

    all = inputFile.read()
    all = re.sub(r'```(?:\w*)(\n.*?)```', r'```python\1```', all, flags=re.S)
    outputFile.write(all)
posted @ 2020-09-19 18:52  Nemo&  阅读(185)  评论(0编辑  收藏  举报