安装和加载R包
1.镜像设置
初级模式
CRAN的镜像,(不能下载Bioconductor的包)

Rstudio也不是每次都能真的从CRAN去下载包,可以通过
options()$repos
来检验
升级模式
自定义CRAN和Bioconductor的下载镜像
# options函数就是设置R运行过程中的一些选项设置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源
# 当然可以换成其他地区的镜像
下次打开Rstudio:下载Bioconductor还是会回到官方镜像,可以查询options()$BioC_mirror
试试,
如果是国内镜像,就不用管了;
如果发现需要再重新运行一遍代码进行设置,那么就需要高级模式
高级模式
不用每次运行一遍镜像设置------R的配置文件 .Rprofile
Rstudio最重要的两个配置文件:在刚开始运行Rstudio的时候,程序会查看许多配置内容,
1.Renviron,它是为了设置R的环境变量(这里先不说它);
2.Rprofile代码文件,如果启动时找到这个文件,那么就替我们先运行一遍(这个过程就是在启动Rstudio时完成的)---[linux中我们在.bashrc文件中添加alias 作为快捷命令]
file.edit('~/.Rprofile') #首先用file.edit()来编辑文件
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源
#保存重启Rstudio
options()$repos
options()$BioC_mirror
2.安装
install.packages(“包”)#安装的包存在于CRAN网站
BiocManager::install(“包”)#安装的包存在于Biocductor
3.加载
均可
library(包)
require(包)
安装加载三部曲
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)
test <- iris[c(1:2,51:52,101:102),]
dplyr五个基础函数
1.mutate()
#新增列

2.
select()
#按列筛选(1)按列号筛选



(2)按列名筛选

3.
filter()
#筛选行
4.
arrange()
按某1列或某几列对整个表格进行排序

5.summarise():汇总

dplyr 两个实用技能
1.管道操作 %>% (cmd/ctr + shift + M)
(加载任意一个tidyverse包即可用管道符号)

2:count统计某列的unique值

dplyr处理关系数据

1.內连inner_join,取交集

2.左连left_join

3.全连full_join

4.半连接:返回能够与y表匹配的x表所有记录semi_join

5.反连接:返回无法与y表匹配的x表的所记录anti_join

6.简单合并
在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,
bind_cols()函数需要两个数据框有相同的行数

网友评论