美文网首页NGS随笔-生活工作点滴
[ZHUHAI_Biotrainee] 第一周_课堂总结

[ZHUHAI_Biotrainee] 第一周_课堂总结

作者: ShanSly | 来源:发表于2019-07-07 23:07 被阅读68次

首先,关于R的基本认识以及基础知识点请看:https://blog.csdn.net/jack237/article/details/8210598,该链接的内容非常全面。
关于周结,其精髓在于第一天晓娟姐的课堂内容。其次,就是做题中涉及到的一些小的问题在前面的总结中也有提到,这里不在赘述。

1、关于Warning

Warning为警告信息
Warning≠Erro #当出现Warning是提醒我们可能有问题,并非绝对,只要input正确,output必然有.比如在Rstudio中,初始值个数>程序默认的循环数,会出现Warning

2、关于路径

绝对路径:从根目录开始直到文件位置
相对路径:相对于程序当前所在目录到文件位置
Eg:程序运行在C:/user/dell下,假设有一个文件test.txt
绝对路径:C:/user/dell/test.txt
相对路径:./test.txt
./ :代表文件所在的目录(可以省略不写)
../ :代表文件所在的父级目录
Eg:
./当前所在目录

setwd("./")                    
getwd()

../父级所在的目录

①setwd("..")    
getwd()

②setwd("../")       #两者的作用相同。  
getwd()

返回上一级目录

③setwd("E:/生信技能树/Qi_study(1 month)/7.2学习/3天培训_R")   
getwd()

3、关于几个快捷键

Alt和- 一起使用为“<-”
Tab 自动补全
Ctrl和L 清空consule
魔幻操作:rm(list=ls())
在网页中搜索:Ctrl+F

4、关于RStudio的使用
打开Rstudio页面,看到红色圈中部分,可以更换project

5、函数

①rm():可以单独清空一个变量,也可以一键清空全部变量。
②rep():生成重复内容的向量
③paste:有默认的分隔符(空格)
④paste0:默认无分隔符
[PS]向量中,元素个数不定时,清楚循环补齐的概念
⑤apply()函数
⑥定义功能函数:function.name<-function{ } 这样的函数在代码中还是很常见的,要掌握哦~ 具体情况具体分析

6、数据

一、数据类型:
A、数值型
B、字符型
C、逻辑型
二、数据结构
A、向量:一维
B、矩阵:二维;长短一致
C、数组:多维
D、数据框:一行或一列为一种数据类型,但是要整齐
F、列表:行与列可以不整齐;列表包含多个数据结构


三、数据的变量名称:
A、组成:数字、字符、下划线 (R的名字尽量避免中文和空格)
B、变量名大小写敏感
C、便于记忆、有意义

7、索引

①必须清楚索引的三种方法:
postion
name
logical [TRUE/FALSE]
[PS]在data.frame中有一种使用符号索引
②data.frame的索引

ID <- c(1,2,3,4,5)
Name <- c("Liming","Xiaofang","Xiaohong","Lihua","Shanshan")
Gender <- c("M","F","M","M","F")
Birthday <- c("1999-10","2000-1","1998-6","2000-6","1999-6")
Score <- c(99,100,69,90,99)
Grade <- c(1,2,2,1,1)
V3 <- data.frame(ID,Name,Gender,Birthday,Score,Grade)
V3

比如使用位置等方法就不说了;也可以使用列的Index或者列名可以选取要访问的哪些列。比如要ID和Name,那么代码为:

idnames <- Name[1:2]

③List
值得注意的是,list的索引要用两个中括号;在list中第一个[]索引,第二个[]代表他是第几个数据结构(可能为向量、字符串、矩阵等)
Eg:

V4 <- list(V4_list=Name <- c("Liming","Xiaofang","Xiaohong","Lihua","Shanshan"),Gender <- c("M","F","M","M"),score <- matrix(1:12,3,4))
>V4
$V4_list
[1] "Liming"   "Xiaofang" "Xiaohong" "Lihua"    "Shanshan"

[[2]]
[1] "M" "F" "M" "M"

[[3]]
     [,1] [,2] [,3] [,4]
[1,]    1    4    7   10
[2,]    2    5    8   11
[3,]    3    6    9   12
>V4[[3]]
    [,1] [,2] [,3] [,4]
[1,]    1    4    7   10
[2,]    2    5    8   11
[3,]    3    6    9   12
> V4[[3]][,1]
[1] 1 2 3

要学会根据根据它显示的内容作出适当的索引,注意查看变化的情况哦。
用名字进行索引

V4$V4_list

④对象中取子集:@

8、运算

取整:%/%
取余:%%

9、矩阵

索引:和向量一样名字 位置 逻辑值
无论是向量还是矩阵取索引时,要注意如果是取一个值,直接用[]即可,如果索引出多个值,需要借助[c()]
Eg:

b<-seq(2,11,1)
b
b[1]
b[c(1,2,4)]

一定要注意如果我们输入的是一个函数,那么在<-的左侧为input的函数,在<-的右侧为输出的函数

10、读入文件

①常见:CSV、table 一套(还有其他的格式,有很多)读入文件:
d<-read.csv('xxx.txt.gz',comment.char = '!',sep='\t',row.names = 1)
其中comment.char = '!'代表!注释信息;row.names = 1代表将第一列作为行名
f<-read.table('xxx.txt.gz', comment.char = '!',header=T,row.names = 1)
读出文件:[2种]
write.table(x = f,file = 'xxx.txt')
write.csv(x = f,file = 'xxx.csv')
②关于在外部读取文件推荐的软件:runotepad++ 右键扩充
EXCEL
TXT
③读入部分 read 都是data.frame
④Rdata的需求
A、存成Rdata格式:
save(f,file = 'xxx.Rdata')
B、常见的如下:

⑤加载load
⑥图标显示.Rdata

11、Packages

①R包来源:
A、CRAN:install.packages()
B、Bioconductor:BiocManager::install() C、Github:devools::install_github()```
②镜像:
当不清楚R包来源时,可以进行谷歌搜索该包,而后在进行安装。 ##注意镜像
镜像推荐:
A、


示范代码如下:

options()$repos
options()$BioC_mirror 
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))

③R包内容:
代码+函数+说明文档+数据集等
[PS]不要庸俗的认为R包只是R包,它的功能很强大的!
安装方法:[对应方式有三种方法]
①.CRAN
Install.packages('')
②.Biocductor
install.packages('BiocManger')
BiocManager::install()
③.github
install.packages('devtools')
devtools::install()

12、作图

之前在学代码的时候 忘记了aes的功能,这里的主要作用是映射


之前讲的脚本plot不是部分清楚,画布等等代码需要仔细仔细再仔细的解决一下!

13、实战部分

进入RStudio进行操作。

相关文章

网友评论

    本文标题:[ZHUHAI_Biotrainee] 第一周_课堂总结

    本文链接:https://www.haomeiwen.com/subject/xrmbhctx.html