学习小组Day 6笔记--安心

作者: 安心_abb1 | 来源:发表于2020-10-28 17:34 被阅读0次

安装和加载R包

1.镜像设置

[1]R的配置文件 .Rprofile

a 用file.edit()来编辑文件:file.edit('~/.Rprofile')
b 添加options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")#对应中科大源 两行代码
c 保存=》重启Rstudio,这时你再运行一下:options()$reposoptions()$BioC_mirror就发现已经配置好了

options函数就是设置R运行过程中的一些选项设置

2 安装

install.packages(“包”)#CRAN网站
BiocManager::install(“包”)#Biocductor

3.加载

library(包)
require(包)

生信星球

运行install.packages("dplyr")

1603873260(1).png

载入程辑包:‘dplyr’

library(dplyr)

dplyr五个基础函数

示例数据test <- iris[c(1:2,51:52,101:102),]

示例数据

1.mutate(),新增列


新增列

2.select(),按列筛选
(1)按列号筛选


列号

(2)按列名筛选

列名
3.filter()筛选行
筛选行
4.arrange(),按某1列或某几列对整个表格进行排序
arrange(test, Sepal.Length)#默认从小到大排序 1603875015(1).png

arrange(test, desc(Sepal.Length))#用desc从大到小

1603875042(1).png
5.summarise():汇总
结合group_by使用实用性强
summarise(test, mean(Sepal.Length), sd(Sepal.Length))# 计算Sepal.Length的平均值和标准差 1603875561(1).png
先按照Species分组,计算每组Sepal.Length的平均值和标准差

dplyr两个实用技能

1:管道操作 %>% (cmd/ctr + shift + M)


1603875749(1).png
2:count统计某列的unique值 1603875994(1).png

dplyr处理关系数据

1.內连inner_join,取交集
2.左连left_join
3.全连full_join
4.半连接:返回能够与y表匹配的x表所有记录semi_join


1603877170(1).png

5.反连接:返回无法与y表匹配的x表的所记录anti_join


1603877591(1).png

6.简单合并
在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数


1603877543(1).png
  1. (Rstudio最重要的两个配置文件:在刚开始运行Rstudio的时候,程序会查看许多配置内容,其中一个就是.Renviron,它是为了设置R的环境变量;而.Rprofile就是一个代码文件,如果启动时找到这个文件,那么就替我们先运行一遍(这个过程就是在启动Rstudio时完成的)

相关文章

网友评论

    本文标题:学习小组Day 6笔记--安心

    本文链接:https://www.haomeiwen.com/subject/apxcvktx.html