merge
pd.merge(left, right, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True, suffixes=('_x', '_y'), how='inner',)
left / right DataFrame对象
on 连接键参数,left、right的连接列名相同时,使用on参数指定
可以指定单列或多列
若所有连接键参数都不指定,以left和right列名的交集做连接键
left_on / right_on 连接键参数,分别用于指定left表与right表的连接列
left_index / right_index 连接键参数,表示以left表/right表的索引做连接键
sort 对合并后的数据排序,默认为True
处理大数据集时,False可提升性能
suffixes left与right有重名列时,合并结果重命名这些列,默认追究_x, _y
how 连接方式,默认inner取交集,left保留左表数据,right保留右表数据,outer取并集
join
用于按索引连接
df.join(other_df, on=None, how=’left’, lsuffix=”, rsuffix=”, sort=False)
other_df 需要关联合并的表,可以是单表,可以是多张表单组成的列表
on 连接键参数
how 默认left,其余同merge
lsuffix / rsuffix 同merge,对于重名列,分别指定左表 / 右表的后缀
sort 是否对合并后的数据排序,默认False
注:两表连接合并时,若A表有索引,B表无索引
B.join(A, on=‘column_in_B’)
concat
默认全连接,join=‘outer’,没有左连接右连接
pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,
keys=None, levels=None, names=None, verify_integrity=False, copy=True)
网友评论