-
一.配置RStudio下载镜像
-
1.Tools-->Global options-->Packages-->Primary CRANrepository-->China(Beijing)...
- 输入命令
options()$
验证
- 输入命令
-
2.输入命令:
options("repos" = c(CRAN="[https://mirrors.tuna.tsinghua.edu.cn/CRAN/](https://mirrors.tuna.tsinghua.edu.cn/CRAN/)"))options(BioC_mirror="options(BioC_mirror="[https://mirrors.ustc.edu.cn/bioc/](https://mirrors.ustc.edu.cn/bioc/)")
添加镜像- 输入命令
options()$BioC_mirror
查询
- 输入命令
-
3.编辑.Rprofile配置文件
-
输入命令:
file.edit('~/.Rprofile')
-
添加代码:
options("repos" = c(CRAN="[https://mirrors.tuna.tsinghua.edu.cn/CRAN/](https://mirrors.tuna.tsinghua.edu.cn/CRAN/)"))options(BioC_mirror="options(BioC_mirror="[https://mirrors.ustc.edu.cn/bioc/](https://mirrors.ustc.edu.cn/bioc/)")
-
保存重启后输入
options()$repos和options()$BioC_mirror
进行验证和options()$BioC_mirror
进行验证
-
-
-
二.安装R包
-
安装命令:
-
1.
install.packages:
安装的包存在于CRAN网站 -
2.BiocManager::install:
安装的包存在于Biocductor -
3.安装BioConductor
-
输入
library("BiocVersion")
等命令检查是否安装过BioConductor -
安装命令;
-
install.packages("BiocManager")
-
BiocManager::install()
-
-
升级BioConducor及相关软件包
-
先卸载当前的安装程序:
remove.packages(c("BiocInstaller", "BiocManager", "BiocVersion"))
-
再次安装新版本:
-
install.packages("BiocManager")
-
BiocManager::install(update=TRUE, ask=FALSE)
-
-
使用旧版软件:
BiocManager::install(version="版本号")
-
-
-
安装加载命令
-
以安装dplyr为例
-
options("repos" = c(CRAN="[https://mirrors.tuna.tsinghua.edu.cn/CRAN/](https://mirrors.tuna.tsinghua.edu.cn/CRAN/)"))
-
options(BioC_mirror="[https://mirrors.ustc.edu.cn/bioc/](https://mirrors.ustc.edu.cn/bioc/)")
-
install.packages("dplyr")
-
library(dplyr)
-
-
-
-
三.dplyr包的应用
-
1.mutate(),新增列
新增一列new,数值为SepalLength 与SepalWidth的乘积.png -
2.select(),按列筛选
-
(1)按列号筛选
选择第一列&选择第一列和第五列.png -
(2)按列名筛选
选择对应的列,将保存至变量vars中.png
-
-
3.filter()筛选行
筛选Species为setosa与versicolor的行.png
筛选Species为setosa对应的行;筛选Species为setosa对应且SepalLength数值大于5的行.png -
4.arrange(),按某1列或某几列对整个表格进行排序
arrange排序默认从小到大排序,输入参数desc后按照从大到小排序.png -
5.summarise():汇总
mean计算平均值sd计算标准差.png
-
6.管道操作 %>% (cmd/ctr + shift + M)
同Linux管道操作,将前面得到的数据作为标准输入
管道操作;按照每一物种计算评价年至(Sepal.Length)与标准差(Sepal.Length).png
7.count统计某列的unique值
通过count统计某一列不同数据的重复次数.png
8.将2个表进行连接
1.內连inner_join,取交集
2.左连left_join
3.全连full_join
4.半连接:返回能够与y表匹配的x表所有记录semi_join
5.反连接:返回无法与y表匹配的x表的所记录anti_join
6.简单合并 思维导图.png 学习大纲.png
网友评论