数据拼盘(2)之拼接

import numpy as np
import pandas as pd
data1 = pd.read_excel("F:数据拼盘1.xlsx",header=0)
data2 = pd.read_excel("F:数据拼盘2.xlsx",header=0)
data3 = pd.read_excel("F:数据拼盘3.xlsx",header=0)

  

#按照行列索引对齐拼接

pd.concat([data1,data2,data3]  #拼接表
          ,axis=1     #沿着方向,默认0,沿着行索引方向连接
          ,join="outer"  #索引的交集还是并集,默认为inner,交集
         )

  

#加入上层索引

pd.concat([data1,data2]
         ,axis=1
         ,keys=["A","B"]  #各表对应的上层索引名称  
         ,names=["一级","二级"]  #不同级别索引的名称,与keys一起使用有效
         )

  

#使用字典的方式加入上层索引

pd.concat({"A":data1,"B":data2}
          ,axis=1
         )

  

#更新索引

pd.concat([data1,data2]
         ,ignore_index=True  #更新索引,默认为false
         )

  

#判断重复

pd.concat([data1,data2]
         ,ignore_index=True  #更新索引,默认为false
         ,verify_integrity=True  #默认为false,打开时候如果有重复则会引发异常
         )

  

posted @ 2020-01-17 19:43  数据骆驼  阅读(130)  评论(0)    收藏  举报