先上思维导图数据类型

向量(vector):重要
矩阵(Matrix)
数组(Array)
数据框(Data frame):重要
List
一、向量
向量
-
1.标量和向量的区分
元素:可为数字或字符串
数字:1,2,3
字符串:s=“abcdefghij”,则s[1]=“a”,s[10]="j"
标量:一个元素组成的变量
向量:多个元素组成的变量
赋值:赋予这个变量一个数值(其实也不一定是数值,还可以是字符串/数据框等等)

-
2.从向量中提取元素
(1)根据元素位置
(2)根据值的大小的
-
根据元素位置
下图应该说是元素,也有可能不是单纯的数值
提取
-
根据数值大小
a[a %in% c(1,2,3)] :存在于向量c(1,2,5)中的元素
2
二、数据框
1、读取本地数据
**read.table(file = "huahua.txt",sep = "\t",header =T) **:读取文件,分隔符为Tab,有表头
a<-read.table(file = "huahua.txt",sep = "\t",header =T) :把这个数据框赋给一个变量a

结果是因为这个软件每次开启时要重置工作目录

终于好了,还是出错了

把数据框赋给变量a

2、设置行名和列名
- 打开本地目录
- colnames(X) :查看列名
- rownames(X) :查看行名,默认值的行名就是行号,1.2.3.4...
- colnames(X)[1]<-"bioplanet":有的公司返回数据,左上角第一格为空,R会自动补为x,用这个命令来修改
- X<-read.csv(file = "huahua.txt",sep = "\t",header =T,row.names=1):最后row.names的意思是修改第一列为行名




3、数据框的导出


4、变量的保存与重新加载
这次没有处理完的数据下次想接着用怎么办?
学会保存和重新加载。保存的格式是RData。
- save.image(file="bioinfoplanet.RData"):保存当前所有变量
- save(frame1,file="frame1.RData"):保存其中一个变量
- load("frame1.RData"):再次使用RData时的加载命令

保存其中一个变量


再次使用RData时的加载命令

5、提取元素

6、直接使用数据框中的变量
提取某两列作散点图:

其中case和value为某列的名称

网友评论