Day6-Gloria-FLY:
1、下载R包:
1.镜像设置:
(1)> options("repos" =c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
(2)> options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
2.下载:install.packages(“包名”)(注意符号也应为英文的)
3.加载:library(包名);require(包名)
总结:options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)
2、dplyr五个基础函数:
1.mutate(),新增列 image.png
2.select(),按列筛选
(1)按列号筛选 image.png
(2)按列名筛选 image.png
3.filter()筛选行 image.png
4.arrange(),按某1列或某几列对整个表格进行排序 image.png
5.summarise():汇总 image.png
image.png
3、dplyr两个实用技能:
1:管道操作 %>% (cmd/ctr + shift + M) image.png
2:count统计某列的unique值 image.png
4、dplyr处理关系数据:
1、将2个表进行连接,注意:不要引入factor image.png
2、內连inner_join,取交集 image.png
3、左连left_join image.png
4、全连full_join image.png
5、半连接:返回能够与y表匹配的x表所有记录semi_join image.png
6、反连接:返回无法与y表匹配的x表的所记录anti_join image.png
7、简单合并:在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数 image.png
image.png
ps:今天的课操作不难,但需要掌握很多函数的意义。
网友评论