美文网首页生信星球培训第六十九期
学习小组Day6笔记-朱殊璇

学习小组Day6笔记-朱殊璇

作者: 朱殊璇 | 来源:发表于2020-07-08 22:08 被阅读0次

    R包的学习:dplyr包

    dplyr包主要用于数据清洗和整理,主要功能有:行选择、列选择、统计汇总、窗口函数、数据框交集等是非常高效、友好的数据处理包。

    一、安装dplyr包

    1.jpg

    二、使用dplyr包:五个基础函数

    1、mutate(),新增列

    2.jpg

    2、select(),筛选列

    (1)按列号筛选

    3.jpg

    (2)按列名筛选

    4.jpg

    3、filter(),筛选行

    5.jpg

    4、arrange(),按某1列或某几列对整个表格进行排序

    6.jpg

    5、summarise(),汇总

    7.jpg

    三、dplyr的两个实用功能

    1、管道操作

    8.jpg

    2、统计某列的unique值

    9.jpg

    四、dplyr处理关系数据:将两个表格进行连接

    10.jpg

    1、inner_join:内连,取交集

    11.jpg

    2、left_join:左连

    12.jpg

    3、full_join:全连

    13.jpg

    4、semi_join:半连接,返回能与y表匹配的x表所有记录

    14.jpg

    5、anti_join:反连接

    15.jpg

    6、简单合并:bind_rows();bind_cols()

    16.jpg

    相关文章

      网友评论

        本文标题:学习小组Day6笔记-朱殊璇

        本文链接:https://www.haomeiwen.com/subject/ptohcktx.html