pandas.read_csv() 部分参数解释

read_csv()所有参数

pandas.read_csv( 　　　　

　　filepath_or_buffer, 　　　　

　　sep=',', 　　　　

　　delimiter=None, 　　　　

　　header='infer', 　　　　

　　names=None, 　　　　

　　index_col=None, 　　　　

　　usecols=None, 　　　　

　　squeeze=False, 　　　　

　　prefix=None, 　　　　

　　mangle_dupe_cols=True, 　　　　

　　dtype=None, 　　　　

　　engine=None, 　　　　

　　converters=None, 　　　　

　　true_values=None, 　　　　

　　false_values=None, 　　　　

　　skipinitialspace=False, 　　　　

　　skiprows=None, 　　　　

　　nrows=None, 　　　　

　　na_values=None, 　　　　

　　keep_default_na=True, 　　　　

　　na_filter=True, 　　　　

　　verbose=False, 　　　　

　　skip_blank_lines=True, 　　　　

　　parse_dates=False, 　　　　

　　infer_datetime_format=False, 　　　　

　　keep_date_col=False, 　　　　

　　date_parser=None, 　　　　

　　dayfirst=False, 　　　　

　　iterator=False, 　　　　

　　chunksize=None, 　　　　

　　compression='infer', 　　　　

　　thousands=None, 　　　　

　　decimal=b'.', 　　　　

　　lineterminator=None, 　　　　

　　quotechar='"', 　　　　

　　quoting=0, 　　　　

　　escapechar=None, 　　　　

　　comment=None, 　　　　

　　encoding=None, 　　　　

　　dialect=None, 　　　　

　　tupleize_cols=None, 　　　　

　　error_bad_lines=True, 　　　　

　　warn_bad_lines=True, 　　　　　　

　　skipfooter=0, 　　　　

　　doublequote=True, 　　　　

　　delim_whitespace=False, 　　　　

　　low_memory=True, 　　　　

　　memory_map=False, 　　　　

　　float_precision=None）

参数用法

sep=','   # 以 “，” 作为数据的分隔符
shkiprows= 10   # 跳过前十行
usecols=['column1', 'column2', 'column3'] # 读取指定列
nrows = 10   # 只取前10行
chunksize=1000 # 分块大小来读取文件(每次读取多少行)，不一次性把文件数据读入内存中，而是分多次
parse_dates = ['col_name']   # 指定某行读取为日期格式
index_col = ['col_1','col_2']   # 读取指定的几列
error_bad_lines = False   # 当某行数据有问题时，不报错，直接跳过，处理脏数据时使用
na_values = 'NULL'   # 将NULL识别为空值

（后续补充）

posted @ 2019-03-13 10:31 ZhuGaochao 阅读(850) 评论(0) 收藏举报

刷新页面返回顶部

TreeSir

Where You From & Where You Go.

pandas.read_csv() 部分参数解释

read_csv()所有参数

参数用法

公告