在 Pandas 中,可使用
DataFrame 对象的
to_csv() 方法将数据写入 CSV 文件。以下从不同场景出发,详细介绍该方法的使用:
将 DataFrame 中的数据以默认设置写入 CSV 文件,to_csv() 方法默认使用逗号作为分隔符,并且会保存行索引。
上述代码会在当前工作目录下创建一个名为 basic_write.csv 的文件,文件内容包含行索引和 DataFrame 中的数据。
若不需要保存 DataFrame 的行索引,可以设置 index 参数为 False。
file_path = 'no_index.csv'
df.to_csv(file_path, index=False)
运行这段代码后生成的 no_index.csv 文件中,不会包含行索引信息。
默认情况下,to_csv() 方法使用逗号作为分隔符,但你可以通过 sep 参数指定其他分隔符,如制表符(\t)、分号(;)等。
file_path = 'semicolon_separated.csv'
df.to_csv(file_path, sep=';', index=False)
此代码会生成一个使用分号作为分隔符的 CSV 文件 semicolon_separated.csv。
当 DataFrame 中存在缺失值(NaN)时,可以使用 na_rep 参数指定缺失值在 CSV 文件中的表示方式。
上述代码会将 DataFrame 中的缺失值用 nan 表示并写入 nan_representation.csv 文件。
如果需要处理非 UTF - 8 编码的文件,可以使用 encoding 参数指定编码方式。
file_path = 'encoded_file.csv'
df.to_csv(file_path, encoding='GBK', index=False)
这里生成的 encoded_file.csv 文件会采用 GBK 编码。
若不需要将 DataFrame 的列名(表头)写入文件,可以设置 header 参数为 False。
file_path = 'no_header.csv'
df.to_csv(file_path, header=False, index=False)
这样生成的 no_header.csv 文件中就不会包含表头信息。