Python入门基础知识点(文本操作)

文件操作基本流程

计算机系统分为:计算机硬件,操作系统,应用程序三部分。

我们用python或其他语言编写的应用程序若想要把数据永久保存下来,必须要保存于硬盘中,这就涉及到应用程序要操作硬件,众所周知,应用程序是无法直接操作硬件的,这就用到了操作系统。操作系统把复杂的硬件操作封装成简单的接口给用户/应用程序使用,其中文件就是操作系统提供给应用程序来操作硬盘虚拟概念,用户或应用程序通过操作文件,可以将自己的数据永久保存下来。

有了文件的概念,我们无需再去考虑操作硬盘的细节,只需要关注操作文件的流程:

#1. 打开文件,得到文件句柄并赋值给一个变量
f=open('a.txt','r',encoding='utf-8') #默认打开模式就为r

#2. 通过句柄对文件进行操作
data=f.read()

#3. 关闭文件
f.close()
f
= open("D:\美女护士教师主妇联系方式.txt",encoding='utf-8',mode='r') print(f.read()) f.close() """ f 变量: f,f1,file,file_handler,fh,f_h..... 文件句柄. open() python的内置函数,python提供的一个功能, 底层调用的是操作系统的调用文件命令,接口. windows: 编码:gbk. linux,ms: 编码是utf-8. 操作文件的流程: 1,打开文件,产生一个文件句柄. 2, 对文件句柄进行相应的操作. 3,关闭文件句柄.

 

很多人会忘记f.close(),,另一种操作方式:使用with关键字来帮我们管理上下文
with open('a.txt','w') as f:
    pass
 
with open('a.txt','r') as read_f,open('b.txt','w') as write_f:
    data=read_f.read()
    write_f.write(data)

文件的打开模式

#1. 打开文件的模式有(默认为文本模式):
r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】
w,只写模式【不可读;不存在则创建;存在则清空内容】
a, 只追加写模式【不可读;不存在则创建;存在则只追加内容】

#2. 对于非文本文件,我们只能使用b模式,"b"表示以字节的方式操作(而所有文件也都是以字节的形式存储的,使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式)
rb 
wb
ab
注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码

#3,‘+’模式(就是增加了一个功能)
r+, 读写【可读,可写】
w+,写读【可写,可读】
a+, 写读【可写,可读】

#4,以bytes类型操作的读写,写读,写读模式
r+b, 读写【可读,可写】
w+b,写读【可写,可读】
a+b, 写读【可写,可读】

 

文件的追加
# a ab a+ a+b
# a 没有文件,创建文件,写入内容
# f = open('a模式',encoding='utf-8',mode='a')
# f.write('很多让人很有成就感的事情')
# f.write('很多让人很有成就感的事情')
# f.write('很多让人很有成就感的事情')
# f.close()

# f = open('a模式',encoding='utf-8',mode='a')
# f.write('666')
# f.close()

# read() readline readlines write close

 

文件的其他操作
# f1 = open('r模式',encoding='utf-8')
# # print(f1.read())
# # print(f1.fileno())  # 用不到
# f1.close()

# f1 = open('其他操作方法',encoding='utf-8',mode='w')
# f1.write('jfkdlsfjdsafkds')
# f1.flush()  # 强制保存
# f1.close()


#  readable writeable

# f1 = open('其他操作方法',encoding='utf-8')
# # print(f1.readable())  # True
# # f1.write('fdsafs')
# print(f1.writable())  # False
# if f1.writable():
#     f1.write('fhdsklafjds')
# f1.close()

# seek  tell
# 网络编程: FTP的作业,断点续传的功能. seek tell
# f1 = open('其他操作方法',encoding='utf-8')
# # f1.seek(9)  # 按照字节调整光标位置
# print(f1.tell())  # 获取光标的位置
# print(f1.read())
# print(f1.tell())
# f1.close()

# truncate  # 对原文件进行截取
# 他必须在可写情况下使用.

# f = open('其他操作方法',encoding='utf-8',mode='r+')
# f.seek(3)  # 调整光标对truncate不管用
# f.truncate(9)  # truncate都是从文件的开始进行截取,以字节为单位.
# f.close()

# 总结:
# 最常用的几个方法 read   seek  tell   flush  readable writeable



# 打开文件的第二种方式:

# 优点:
# 1,省去了写f.close()
# with open('其他操作方法',encoding='utf-8') as f1:
#     print(f1.read())

# 2,一个with语句可以操作多个文件句柄.

# with open('其他操作方法',encoding='utf-8') as f1,\
#         open('r模式',encoding='utf-8',mode='w') as f2:
#     print(f1.read())
#     f2.write('5435435')
#     f2.write('dhfjkdshjfdskhf')

# 缺点:

# IOError
with open('其他操作方法', encoding='utf-8') as f1:
    print(f1.read())
    # ******各种逻辑******
    f1.close()
    with open('其他操作方法', encoding='utf-8', mode='w') as f2:
        pass

 

文件的改
# 1,以读的模式打开原文件.
# 2,以写的模式创建一个新文件.
# import os
# with open('alex自述',encoding='utf-8') as f1,\
#     open('alex自述.bak',encoding='utf-8',mode='w') as f2:
# # 3,将原文件内容读取出来,按照你的要求改成新内容,写入新文件.
#     old_content = f1.read()
#     new_content = old_content.replace('alex','sb')
#     f2.write(new_content)
# # 4,删除原文件.
# os.remove('alex自述')
# # 5,将新文件重命名成原文件.
# os.rename('alex自述.bak','alex自述')

# 高大上版
#
# 1,以读的模式打开原文件.
# 2,以写的模式创建一个新文件.
# import os
# with open('alex自述',encoding='utf-8') as f1,\
#     open('alex自述.bak',encoding='utf-8',mode='w') as f2:
# # 3,将原文件内容读取出来,按照你的要求改成新内容,写入新文件.
#     for old_line in f1:
#         new_line = old_line.replace('alex','sb')
#         f2.write(new_line)
#
# # 4,删除原文件.
# os.remove('alex自述')
# # 5,将新文件重命名成原文件.
# os.rename('alex自述.bak','alex自述')

# ret = 'alex dfjaslkdf'
# print(ret.replace('太白','男神'))

深浅copy

# 赋值运算 变量指向的是同一个.
# l1 = [1, 2, 3, [11, 22]]
# l2 = l1
# # l2.append(666)
# l2[-1].append(666)
# # print(l1)
# # print(l2)
# print(l1)
# print(l2)


# 浅copy 列表举例
# dict set
# copy 复制, 浅浅的复制一份.
l1 = [1, 2, 3, [11, 22]]
l2 = l1.copy()

# print(l2)  # [1, 2, 3, [11, 22]]
# print(id(l1))
# print(id(l2))
# print(id(l1[0]))
# print(id(l2[0]))
# print(id(l1[-1]))
# print(id(l2[-1]))
# 给l1添加一个元素,l2 不变
# l1.append(666)
# l1[-1].append(666)
# print(l1)
# print(l2)

# l1 = [1, 2, 3, [11, 22]]
# l2 = l1.copy()
# l1[0] = 5
# print(l1)
# print(l2)
# 浅copy: 无论是同一个代码块,不同代码块下:
# 复制一个外壳(列表),但是列表里面的所有元素,都共用一个.


# 深copy : 深深的复制一下.
import copy
l1 = [1, 2, 3, [11, 22]]
l2 = copy.deepcopy(l1)
# print(l1)
# print(l2)
# print(id(l1),id(l2))
# 不可变数据类型  # 共用一份
# print(id(l1[0]))  # 1868196880
# print(id(l2[0]))  # 1868196880

# 可变的数据类型  重新创建一份
# print(id(l1[-1]))  # 2158525445320
# print(id(l2[-1]))  # 2158525446792

# l1[-1].append(666)
# print(l1)
# print(l2)


# 深copy: 论是同一个代码块,不同代码块下:
# 不仅创建一个新外壳(列表),外壳里面的可变的数据类型也创建一份新的,但是不可变的数据类型共用一个.


# 面试题
# l1 = [1, 2, [11,]]
# l2 = l1[:]  # 全切: 浅copy
# l1[-1].append(666)
# print(l2)


# l1 = [1, 2, [11,]]
# l2 = l1.copy()
# l1[-1].append(666)
# print(l2)

对于深copy来说,列表是在内存中重新创建的,列表中可变的数据类型是重新创建的,列表中的不可变的数据类型是公用的。

 

posted @ 2019-03-10 21:04  四块钱  阅读(391)  评论(0编辑  收藏  举报
ヾ(≧O≦)〃嗷~