学习使用dplyr包
-安装加载包
install.packages("dplyr")
library(dplyr)
- 五个基本函数的使用
1.mutate()
新增数据框的变量
mutate(x,newvar=)
2.select()挑选变量
select(x,1,2...) 3.filter()行筛选
filter(x,var=某观测值)`
4..arrange(),按某1列或某几列对整个表格进行排序
5.summarise():汇总感觉跟summary()函数有相似之处 - dplyr包的使用技巧
1.管道操作 %>% (cmd/ctr + shift + M)这个在linux上面的原理一样
2.count统计某列的unique值 - dplyr处理关系数据
1.內连inner_join,取交集
inner_join(test1, test2, by = "x")
2.左连left_join
left_join(dataframe1, dataframe2, by = 'x')
3.全连full_join
full_join( test1, test2, by = 'x')
4.半连接:返回能够与y表匹配的x表所有记录semi_join
5.反连接:返回无法与y表匹配的x表的所记录anti_join
6.简单合并:rbind cbind.
网友评论