dplyr包的join函数

作者: LeoinUSA | 来源:发表于2018-07-02 08:32 被阅读3次

    dplyr中有非常多非常有用的功能,例如filter(),arrange(),select(),mutate(),group_by()。但是这篇教程是谈join函数。

    join函数在dplyr包中是个系列函数。 join函数:

    join(x, y, by = NULL, copy = FALSE, ...)
    
    • x,y 为合并的数据框,不要求x,y中排序列唯一
    • by 为排序依据,默认值Null时按名字相同的量匹配,此时,要求必须有相同列名的列
    • join为系列函数,包括inner_join、left_join、semi_join和anti_join函数

    full_join()

    full_join连接后的记录数等于”共有的记录数+a独有的记录数+b独有的记录数“,结果可以理解为a、b的并集。

    inner_join

    inner_join连接后的记录数等于”共有的记录数“, 也就是5,结果可以理解为a、b的交集,R语言中的merge函数也可以实现。

    left_join

    left_join连接后的记录数等于”a的记录数“,当然,a是需要放在第一个参数。

    right_join

    right_join连接后的记录数等于”b的记录数“。

    相关文章

      网友评论

        本文标题:dplyr包的join函数

        本文链接:https://www.haomeiwen.com/subject/jownyftx.html