DAY5 R语言数据结构
重要提醒(by生信星球花花老师)
(1)R的赋值符号不是等号,而是<-
(2)在Console 控制台输入命令,相当于Linux的命令行
(3)R的代码都是带括号的,括号必须是英文的。
(4)显示工作路径 getwd()
(5)向量是由元素组成的,元素可以是数字或者字符串。
(6)表格在R语言中改名叫数据框_
(7)别只复制代码,要理解其中的命令、函数的意思。函数或者命令不会用时,除了百度/谷歌搜索以外,用这个命令查看帮助:?read.table,调出对应的帮助文档,翻到example部分研究一下。
(8)数据类型(重点只有两个,剩下的不看)
向量
标量和向量的区分
- 元素指数字或者字符串
- 标量:一个元素构成的变量
- 向量:多个元素构成的变量
常用向量
image.png从向量中提取元素
- 根据元素位置:
x[4] #x第4个元素
x[-4]#排除法,除了第4个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)] #第1个和第5个元素
- 根据值
x[x==10]#等于10的元素
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素
数据框
读取数据
输入X<-read.csv(file="huahua.txt",sep="",header = T)
或者``X<-read.table(file="huahua.txt",sep="/t",header = T)`
设置行名和列名
colnames(X)[1]<-"a" #将第一行名改为a
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)#row.names=1的意思是修改第一列为行名
数据框导出
输入write.table(X,file="bio.txt",sep="",quote = F)
变量保存和加载
save.image(file="bioinfoplanet.RData")#保存当前所有变量
save(X,file="test.RData")#保存其中一个变量
load("test.RData")#再次使用RData时的加载命令
元素提取
X[x,y]
#第x行第y列
X[x,]
#第x行
X[,y]
#第y列
X[y]
#也是第y列
X[a:b]
#第a列到第b列
X[c(a,b)]
#第a列和第b列
X$列名
#提取列
网友评论