R语言手册

作者: wo_monic | 来源:发表于2019-09-30 11:20 被阅读0次

创建重复元素

rep(c("A","B","C"),times=3) #向量整体3个重复
#"A" "B" "C" "A" "B" "C" "A" "B" "C"
rep(c("A","B","C"),each=2) #向量内部各个元素重复2遍
#"A" "A" "B" "B" "C" "C"
rep(c("A","B","C"),each=2,times=3) #向量内部各个元素重复2遍,整体再重复三次
# "A" "A" "B" "B" "C" "C" "A" "A" "B" "B" "C" "C" "A" "A" "B" "B" "C" "C"
sample1 <- rep(c("A","B","C","D","E"),times=1,each=3) #先让每个元素重复3次(times和each可以分别对应技术重复和生物学重复)
paste0(sample1,1:3) #再和1:3的向量拼合,即实现生成样本的多次重复的名称
# "A1" "A2" "A3" "B1" "B2" "B3" "C1" "C2" "C3" "D1" "D2" "D3" "E1" "E2" "E3"
  1. 目录与文件操作参考

    1. 创建目录 dir.create("ABC/")

      列出当前目录的文件夹结构 list.dirs()

      列出当前目录内所有文件 dir()

    2. 创建文件 file.create("ABC/README.MD")

    3. 删除文件夹 unlink("ABC",recursive=TRUE)

    4. 删除文件 file.remove("ABC/123.txt")

    5. 移动文件 file.copy(from="C:/user/data.csv",to="D:/geneinfo/")

    6. 追加文件 file.append(file1,file2)

    7. 可以手动选择文件 file.choose(new=FALSE)

    8. file.show

    9. file.edit("gene.csv") #编辑文件,如果不存在则先创建再编辑

  2. 字符值的处理

    • 字符串函数参考

      • 返回向量,列表,矩阵,数据框元素个数 lengeh(list1)

      • 返回字符串的字符数 nchar(head(list1))

      • 拼接字符串 cat("this is ","a test ","file")

        当行很长时可以设置fill自动换行。

        cat("长字符串","changzifuchuan ","很长很长的字符串",fill=TRUE)

        cat("长字符串","changzifuchuan ","很长很长的字符串",fill=30)

      • 获取字符串的字串

        substr("asddfcerwv4rwevw4rvrfeed32e4ef32",1,6) 输出第1到6个字符

        substring("asddfcerwv4rwevw4rvrfeed32e4ef32",1:5,5:6)

      • grep()函数可以接受正则

      • strsplit()可以接受正则

        strsplit(str,'+') #分割一段话,以空格分割

        strsplit(str,split=', ')#以,分割

    • NA的处理[参考] (https://blog.csdn.net/Ssxysxy123/article/details/51774472)

      • 删除空值 (可以是向量,list,dataframe)

        na.omit=TRUE #在某些函数中的参数

        data <- na.omit(data) #删除data中的空值

      • 统计缺失值的个数 sum(is.na(Gene_id))

      • 统计完整值的个数 sum(complete.cases(geneID))

  3. dplyr包的使用

    参考1

  4. 正则匹配

  5. 包的安装使用参考

    1. 安装方式1 install.packages("ggplot2")

    2. 方式2

   if (!requireNamespace("BiocManager", quietly = TRUE))
        BiocManager::install("DESeq2")
        install.packages("BiocManager")
        install.packages("pheatmap")
        ##从本地安装包(一般不建议,需要自己解决包的依赖包问题)
        install.packages("./BiocInstaller_1.20.1.zip", repos = NULL)


* 包的载入 library("ggplot2")
* 包的卸载 (是从加载的环境卸载,不是删除) detach("package:ggplot2")
* 包的删除 remove.package(c("pkg1","pkg2"),lib=file.path("path"),"to","library")
pkg1,pkg2表示要删除的包的名字,一次可以删除多个包
"path", "to", "library"表示R的库路径,字符向量,通常情况下只输一个路径即可。使用命令.libPaths()可以查看库路径。
* remove.packages(c('AnnotationHub'),lib=file.path('G:/R-3.6.1/library'))**
3. * 查看已安装的包 参考 installed.packages()[,c('Package','Version','LibPath')]
    *   查看已加载的包 `(.packages())`

4.  某个包无法更新或者更新失败 终极大招,关闭R和R-studio,删除library这个文件夹下对应的包的文件夹。library的路径可以从上一步看出。我的是G:/R-3.6.1/library

5.  更新所有包 `update.packages()`

6.  查看R版本 `R.version`

7.  citation()用于查看指定包的文献引用

    `citation("clusterProfiler")` 会返回该包的作者信息,方便写文章时引用。
  1. 帮助

    • 某个包的帮助 help(package="ggplot2")

    • 某个函数属于哪个包 help(函数名)或者?函数名

    • 打开所有的帮助文档 help.start()

    • 对于某个函数的具体用法,可以光标放在该函数上,按下F1查看帮助

  2. 数据的保持与清除

    1. 清屏 ctrl+L

    2. 显示目前存储在R中的对象的名字 objects()

    3. rm(x,y,temp) 删除x,y,temp这些对象

      由于R中会把所有的数据对象保存到工作环境,即.RData中。再次启动时,会把这些变量挂载上,所以如果不需要使用了,就删除对象。

    输出当前工作环境的包和R的版本信息 (主要用于问题解决和包的开发等环境时使用) sessionInfo()

参考地址:

  1. https://www.cnblogs.com/einyboy/p/3182589.html
  2. Y叔所有文章传送门

R里面科学计数法

一定要注意,R里面传入科学计数法的格式和想象的并不一样。

  • 常规的科学计数法 3.58X10E-9
  • R里面对应的表示法3.58E-9
    特别注意,R里表示10的次幂时,不是10E
    R里10E6的输入是1E6
    科学计数法和非科学计数法相互转换
y <- 3.8981E5
format(y,scientific = F) #"389810"
format(y,scientific = T,digits = 4) #"3.898e+05" digits是保留的数字的位数

控制台的输出

  • print() print("this is a test file") 出来的内容前面总是有一个[x]
  • warning() warning("The less than 0.05 value will be delete!") 出来的内容是红色的:第一行是Warning message: 一般用于警告,引起重视。
  • stop() stop("Need 3 parameter!") 内容是红色的,而且会中断程序。用于中断程序,并给出报错信息
  • message() message("Outfile is ","new.csv") 内容是红色的。一般是给出重要的信息 message内置了paste0函数,所以会自动拼接多个字符。

函数内的变量的作用域问题

函数内的变量是局部变量,在函数外是无法访问的。可以使用return(函数名)来返回函数,用于闭包。当然也可以在函数内使用全局变量。全局变量赋值使用的是<<-,格式:变量名<<- 变量值.一般不推荐使用全局变量,全局变量不利于大的项目的管理。

相关文章

  • R语言手册

    (jianshu不支持多级目录,无奈了。) 目录与文件操作参考创建目录 dir.create("ABC/")列出当...

  • 备战美赛

    如果仍然选择大数据处理这块,那么对于R语言的运用必须得较为精通,学习资料有两大块:R语言实战,R数据可视化手册,T...

  • 代写CS留学生|金融编程|C++语言|JAVA|R语言|Pyth

    代写留学生金融类题目必读手册(含收费标准) 代写金融商科必读手册 常用语言: Matlab , Python ,R...

  • 「r<-统计」统计检验函数汇总

    资料来源:《R 语言核心技术手册》和 R 文档数据基本来自胡编乱造 和 R 文档 本文基本囊括了常用的统计检验在 ...

  • [R] 之前报错记录收集

    Rcolorbrewer简略学习 参考:R数据可视化手册第12章 R语言实战第三章(p.51) 在ggplot中调...

  • annoPeakR:一个peak注释的在线工具

    欢迎关注”生信修炼手册”! annoPeakR是一个peak注释工具,基于R语言中的shiny包开发出的web应用...

  • R 语言绘图速查手册(58图)

    本文参考 《R 语言绘图速查手册 v0.1beta》 图目录1 基本散点图;200 个正态分布的随机数2 poin...

  • 学习小组Day4笔记-皇晓燕

    R语言和R studio R语言是全面的统计分析平台,计算作图等等 R studio是R语言的操作平台 下载R语言...

  • Day4 学习小组--张小张

    今天是 R 语言基础的学习 了解R与Rstudio R 语言是一款统计软件; R 语言也是一门编程语言,语言也是一...

  • 学习小组Day4笔记--扬马延

    R语言学习 1. R以及R studio安装 直接搜索R语言网页可直接安装 2. R语言入门 参考书目《R for...

网友评论

    本文标题:R语言手册

    本文链接:https://www.haomeiwen.com/subject/usmcpctx.html