记录一次pandas合并不规则的csv文件

import re
import pandas as pd
import glob
import numpy as np
csv_list = glob.glob('E:/web_project/*.csv')

# dataframe.to_csv(r"路径表达式",sep=",")#存储


for i in csv_list[42:]:
    print(i)
    data = pd.read_csv(i, encoding='gbk',error_bad_lines=False, skiprows=4)
    d1 = np.array(data['字段'][:-4])
    d2 = np.array(data['字段'][:-4])
    d3 = np.array(data['字段'][:-4])
    d4 = np.array(data['字段'][:-4])
    d5 = np.array(data['字段'][:-4])
    d6 = np.array(data['字段'][:-4])
    d7 = np.array(data['字段(+元)'][:-4])
    d8 = np.array(data['字段(-元)'][:-4])
    d9 = np.array(data['字段(元)'][:-4])
    d10 = np.array(data['字段'][:-4])
    d11 = np.array(data['字段'][:-4])
    d12 = np.array(data['字段'][:-4])
    d13 = []
    for j in data['备注'][:-4]:
        d13.append(re.sub('[\d]+', '', j))

    dataframe = pd.DataFrame({"字段": d1, "字段": d2, "字段":d3, "字段": d4,
                              "字段": d5, "字段": d6, "字段": d7, "字段": d8,
                              "字段": d9, "字段": d10, "字段": d11, "字段": d12, "字段": d13})
    dataframe.to_csv(r"./4.csv", mode='a', index=False)

#  表示获取剔除前几行:skiprows

#, 文件操作:mode    a代表追加,跟python文件操作一样

posted @ 2021-04-02 11:07  阿磊小哥哥呀  阅读(86)  评论(0编辑  收藏  举报