读取和写入
# 读取
df_txt = pd.read_table('tablename.txt')
df_txt = pd.read_table('tablename.txt', sep = '\t') # 指定分割符
df_csv = pd.read_csv('tablename.csv')
df_excel = pd.read_excel('tablename.xlsx')
df_excel = pd.read_excel(
'tablename.xlsx',
header = None, # 第一行不是列名
index_col = ['col1', 'col2'], # 指定索引列
usecols = ['colname1', 'colname2'], # 指定读取的列,默认读取全部,指定后则只读取指定列。
parse_dates=['col5'], # 对col5进行时间转换
nrows = 2, # 读取的行数
)
# 写入
df_csv.to_csv('filename.csv', index = False)
df_txt.to_csv('filename.txt', sep='\t', index = False) # to_csv也可以保存为txt文件,指定制表符为分隔符
df_excel.to_excel('filename.xlsx', index = False)
数据结构
Series
DataFrame