17、pandas的merge合并函数

17、pandas的merge合并函数

作者: 让数据告诉你 | 来源:发表于2017-12-27 16:45 被阅读0次

Pandas 7.合并 merge
17、pandas的merge合并函数
2018-04-07 PANDAS 数据合并与重塑（join/m
Python的合并数据集
【Chapter 8.2】合并数据集
R语言reshape2包处理数据2021.3.6
利用Python进行数据分析(12) pandas基础: 数据合
pandas _合并 merge
Pandas 合并merge
数据规整化:清理、转换、合并、重塑

在使用Excel时，我用的最多函数就是vlookup；在使用SQL查询的时候，我用的最多应该是join；这两个都有相同的功能，将多表匹配、合并，然后达到对比、查漏等等效果。在pandas里面也有类似的功能函数就是pd.merge()（pd是指导入的pandas库）。merge的用法跟SQL中join很像。

df1

df2

使用merge进行合并：

使用merge进行合并

基本的结构为：pd.merge（df1，df2，合并方式，df1合并用的键，df2合并用的键）。

后面两个参数在合并的时候两个表格使用的键的列名是一样的时候可以改成on='title'：

on='title'

结果和第一种方式是一样的。

使用合并的时候pandas会默认只选取一个相同的键列名，然后其它的数据进行合并。

注意到两张表格中有一个location_road是共同具有的一个列，因此合并之后两个表格的location_road列分别加上了_x和_y的后缀以便区分，这两个后缀也可以修改的（使用suffixes函数进行修改）：

使用suffixes函数修改后缀

merge函数还可以只取其中的某几列数据进行合并：

选择某几列进行合并

选择某几列的时候需要注意的是如果使用on参数，那么此参数指定的值两个表格都要有；还有一个非常重要的就是选择多列的时候使用的是两个中括号。

使用merge合并方式有left, inner, right，outer，通过how参数来指定。

how = 'inner'表示的是只合并两个表格都具有的行；

how = 'left'表示的是合并之后显示的是第一个表格里的所有行；

how = 'left'

第一个表与合并之后的表对比

how = 'right'表示的是合并之后显示的是第二个表格里所有的行；

how = 'right'

第二个表与合并之后的表对比

细心的人肯定会发现了，为什么使用how = 'right'合并之后的行数不是等于第二个表的行数呢？这是因为在第一个表的title列中有一个重复值被计算进去了，所有多了一行（关于重复值的去除方法可以参考duplicated那篇的内容）。

how = 'outer'表示的是两个表格里所有的行都进行合并。

how = 'outer'

在使用left，right，outer的时候会产生空值，只要在语句的后面加.fillna(o)就可以填充空值了。

填充空值之后的表格

这也是pandas很方便的一个特点：多个函数可以连在一起使用，只要用点连接起来就可以了。

如果合并的时候要用索引作为键的话就不能用on，left_on和right_on了，而是要使用left_index=True, right_index=True（也就是以索引为标准来进行表联结，而不是两个表共同拥有的列）。

保留连接的列

因为是以索引作为联结的，所以title不是对应的，这个暂时还不清楚有什么比较好的应用场景。

还有这个方法合并的时候是安装键的顺序进行排列的，如果两个表都很大的话合并时就会很慢，如果不需要排序就需要添加参数sort=False。

merge还有一个参数，indicator=True，这个参数会添加一列用来注明每一行是来自于哪个表的：

使用indicator=True

以上所说的都是横向合并，那么如果要进行纵向合并要怎么操作呢？

merge()里并没有axis=0这个参数，如果需要纵向匹配合并的话可以先将表格转置（.T）之后再进行合并。

相关文章

Pandas 7.合并 merge
Pandas7 pandas合并 merge %concatenating比merge简单的dataframe合并...
17、pandas的merge合并函数
在使用Excel时，我用的最多函数就是vlookup；在使用SQL查询的时候，我用的最多应该是join；这两个都有...
2018-04-07 PANDAS 数据合并与重塑（join/m
PANDAS 数据合并与重塑（join/merge篇）
Python的合并数据集
Python 的pandas能够通过一些内置的方式进行数据集的合并。Pandas.merge函数可以实现根据一个或...
【Chapter 8.2】合并数据集
【Chapter 8.2】合并数据集 pandas里有几种方法可以合并数据： pandas.merge 按一个或多...
R语言reshape2包处理数据2021.3.6
1. merge函数合并数据 merge函数通过by选择合并某列的相同值。 2. reshape2包合并数据这个...
利用Python进行数据分析(12) pandas基础: 数据合
pandas 提供了三种主要方法可以对数据进行合并： pandas.merge()方法：数据库风格的合并； pan...
pandas _合并 merge
pandas中的merge和concat类似,但主要是用于两组有key column的数据,统一索引的数据. 通常...
Pandas 合并merge
通过key合并通过多个keys合并 how = ['left','right','outer','inner']...
数据规整化:清理、转换、合并、重塑
合并数据集 pandas对象中的数据可以通过一些内置的方式进行合并: pandas.merge根据一个或多个键将不...

网友评论

本文标题：17、pandas的merge合并函数

本文链接：https://www.haomeiwen.com/subject/yyrugxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

Python数据分析

热点阅读

Python数据分析

我爱编程

关于我们|服务条款|联系我们|17、pandas的merge合并函数|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！