美文网首页生信星球培训第108期
20210516【生信星球】数据结构

20210516【生信星球】数据结构

作者: 我就是那只猪脚 | 来源:发表于2021-05-17 00:48 被阅读0次

· 小知识点

  • 表格在R语言中改名叫数据框
  • 数据类型
    向量(vector)
    数据框(Data frame)
    矩阵(Matrix)
    数组(Array)
    List

Part1 向量

1.标量和向量的区分

首先明确“元素”的意思,元素指的是数字或者字符串(用chr表示)等,根据它可以区分两个词:
标量:一个元素组成的变量
向量:多个元素组成的变量

赋值:

x<- c(1,2,3) #常用的向量写法,意为将x定义为由元素1,2,3组成的向量。
x

x<- 1:10 #从1-10之间所有的整数
x

x<- seq(1,10,by = 0.5) #1-10之间每隔0.5取一个数(注意是逗号不是分号)
x

x<- rep(1:3,times=2) #1-3 重复2次
x

如果你把这几行代码都打过了,那么x就被你赋值了4次,结果就是,第一次赋值被第二次的覆盖了,第二次的赋值又被第三次的覆盖了,以此类推,以最后一次为准。

2.从向量中提取元素

(1)根据元素位置

#这里的x是你刚才赋值的变量名,根据自己的情况来修改
x[4] #x第4个元素
x[-4]#排除法,除了第4个元素之外剩余的元素
x[2:4]#第2到4个元素
x[-(2:4)]#除了第2-4个元素
x[c(1,5)] #第1个和第5个元素

(2)根据值

x[x==10]#等于10的元素
x[x<0]
x[x %in% c(1,2,5)]#存在于向量c(1,2,5)中的元素

Part2 数据框

# 读取本地数据
# 读取huahua文件
X <- read.csv("huahua.txt",sep = "",header = T,row.names = 1)
# 读取doudou文件
A <- read.csv("doudou.txt")

# 设置行列名
colnames(X) #查看列名
rownames(X) #查看行名,默认值的行名就是行号,1.2.3.4...
colnames(X)[1]<-"bioplanet"#有的公司返回数据,左上角第一格为空,R会自动补为x,用这个命令来修改
X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)#最后row.names的意思是修改第一列为行名

# 数据框导出
write.table(X,file = "yu.txt",sep = ",",quote=F)#分隔符改为逗号,字符串不加双引号(默认格式带由双引号) 

# 变量的保存与重新加载
#这次没有处理完的数据下次想接着用怎么办?--学会保存和重新加载。保存的格式是RData。
save.image(file="bioinfoplanet.RData")#保存当前所有变量
save(X,file="test.RData")#保存其中一个变量
load("test.RData")#再次使用RData时的加载命令

# 提取元素
x[x,y] #提取x行y列
x[x,] #提取x行
x[,y] #提取y列
x[y] #默认列
x[a:b] #提取a-b列
x[c(a,b)] #提取a,b两列
x$Y #提取x的Y列,但只能提取一列


- 致谢:生信星球@刘小泽@小洁忘了怎么分身

相关文章

网友评论

    本文标题:20210516【生信星球】数据结构

    本文链接:https://www.haomeiwen.com/subject/guedjltx.html