R包的学习:dplyr包
dplyr包主要用于数据清洗和整理,主要功能有:行选择、列选择、统计汇总、窗口函数、数据框交集等是非常高效、友好的数据处理包。
一、安装dplyr包
1.jpg
二、使用dplyr包:五个基础函数
1、mutate(),新增列
2.jpg
2、select(),筛选列
(1)按列号筛选
3.jpg
(2)按列名筛选
4.jpg
3、filter(),筛选行
5.jpg
4、arrange(),按某1列或某几列对整个表格进行排序
6.jpg
5、summarise(),汇总
7.jpg
三、dplyr的两个实用功能
1、管道操作
8.jpg
2、统计某列的unique值
9.jpg
四、dplyr处理关系数据:将两个表格进行连接
10.jpg
1、inner_join:内连,取交集
11.jpg
2、left_join:左连
12.jpg
3、full_join:全连
13.jpg
4、semi_join:半连接,返回能与y表匹配的x表所有记录
14.jpg
5、anti_join:反连接
15.jpg
6、简单合并:bind_rows();bind_cols()
16.jpg
网友评论