数据拼盘(2)之拼接

import numpy as np
import pandas as pd
data1 = pd.read_excel("F:数据拼盘1.xlsx",header=0)
data2 = pd.read_excel("F:数据拼盘2.xlsx",header=0)
data3 = pd.read_excel("F:数据拼盘3.xlsx",header=0)

#按照行列索引对齐拼接

pd.concat([data1,data2,data3]  #拼接表
          ,axis=1     #沿着方向，默认0，沿着行索引方向连接
          ,join="outer"  #索引的交集还是并集，默认为inner，交集
         )

#加入上层索引

pd.concat([data1,data2]
         ,axis=1
         ,keys=["A","B"]  #各表对应的上层索引名称  
         ,names=["一级","二级"]  #不同级别索引的名称，与keys一起使用有效
         )

#使用字典的方式加入上层索引

pd.concat({"A":data1,"B":data2}
          ,axis=1
         )

#更新索引

pd.concat([data1,data2]
         ,ignore_index=True  #更新索引，默认为false
         )

#判断重复

pd.concat([data1,data2]
         ,ignore_index=True  #更新索引，默认为false
         ,verify_integrity=True  #默认为false，打开时候如果有重复则会引发异常
         )

posted @ 2020-01-17 19:43 数据骆驼阅读(130) 评论(0) 收藏举报

刷新页面返回顶部