数据拼盘(2)之拼接
import numpy as np
import pandas as pd
data1 = pd.read_excel("F:数据拼盘1.xlsx",header=0)
data2 = pd.read_excel("F:数据拼盘2.xlsx",header=0)
data3 = pd.read_excel("F:数据拼盘3.xlsx",header=0)
#按照行列索引对齐拼接
pd.concat([data1,data2,data3] #拼接表
,axis=1 #沿着方向,默认0,沿着行索引方向连接
,join="outer" #索引的交集还是并集,默认为inner,交集
)
#加入上层索引
pd.concat([data1,data2]
,axis=1
,keys=["A","B"] #各表对应的上层索引名称
,names=["一级","二级"] #不同级别索引的名称,与keys一起使用有效
)
#使用字典的方式加入上层索引
pd.concat({"A":data1,"B":data2}
,axis=1
)
#更新索引
pd.concat([data1,data2]
,ignore_index=True #更新索引,默认为false
)
#判断重复
pd.concat([data1,data2]
,ignore_index=True #更新索引,默认为false
,verify_integrity=True #默认为false,打开时候如果有重复则会引发异常
)
1.本篇所有数据文件小博已上传,需要的小伙伴到“文件”进行下载使用。数据文件纯属学习教学所用,纯属虚构。
2.文章中的代码都是经过小博的真实操作,可以执行。(注:Anaconda3的Jupyter notebook)
浙公网安备 33010602011771号