在进行数据分析之前,可能需要读写自己的数据文件。或者在完成数据分析之后,想把结果输出到外部的文件
在Python中,利用pandas模块中的几个函数,可以轻松实现这些功能,利用pandas读取文件之后数据的格式为数据框,且如果想用pandas将数据输出为外部文件,也要先确保要输出的文件的格式为数据框
注意因为这里演示了文件的操作,需要将文件上传到网站的数据文件目录下才可以成功运行程序

 

import pandas as pd
#首先导入pandas库   as pd是将这个库缩写 之后调用这个库 只需要写pd就可以了 而不用写全称pandas
View Code

10.1 读取txt文件

以空格分隔的txt文件

import pandas as pd
text=pd.read_table('read_txt.txt',index_col=0,delimiter=' ')
#  文件所在的路径是必须输入的
# index_col=0指定第一列为index
# delimiter指定了数据间的分隔符,分隔符可以使空格,制表符,;等等
# 这个函数中还有很多参数可以定义
print(text)
View Code

(2)第二种方法

#‘r’--只读模式,‘w’--只写模式,注意写模式会把源文件清空
text_file=open('read_txt.txt','r')
#是否可读
print(text_file.readable())
#是否可写
print(text_file.writable())
#一次性读取,光标至最末尾
print(text_file.read())
#按行读取,以光标位置开始
print(text_file.readline(),end='')
print(text_file.readline(),end='')
print(text_file.readline(),end='')
#关闭文件
text_file.close()
View Code
除了以上方法,也可用with、contextlib都可以打开文件,且自动关闭文件,

readlines()一次性读取文本的所有内容,结果是一个list
with open(file) as f:
  for line in f.readlines():
     print line
这种方法读取的文本内容,每行文本末尾都会带一个'\n'换行符 (可以使用L.rstrip('\n')去掉换行符)
View Code