concat
import pandas as pd
df1 = pd.read_excel('777.xlsx')
df2 = pd.read_excel('666.xlsx')
df = pd.concat([df1, df2])
df.to_excel('999.xlsx')
merge
merge通过一个或者多个键将两张表合并在一起
merge(left,right,how='inner',on=None,left_on=None,right_on=None,
left_index=False,right_index=False,sort=False,suffixes=('_x','_y'),copy=True)
- on 指定合并时依据的列名,单列时后跟字符串,多列时后跟字符串列表
- how 表示连接方式,inner交集,outer并集,left和right表示根据某一边
当仅有两个参数merge(left,right)时,on默认的是相同列名,how默认为inner
- suffixes 参数指定当两个表合并后有相同的列名时,在列名上加的前缀,默认为元组('_x','_y')
- left_on=None,right_on=None,两个表的列名不同却要根据这两个列名下的属性值来合并的时候使用
df1 = pd.read_excel('已爬取完成 20220908测试2.xlsx')
df2 = pd.read_excel('已爬取完成 20220908测试3.xlsx')
df = pd.merge(df1, df2, on=['采集链接'], how='outer') # on=['采集链接', '房产证号']
df.to_excel('777.xlsx')