生信小组DAY5-JANE

作者: Jane_30e5 | 来源:发表于2019-01-19 00:12 被阅读69次

数据类型

先上思维导图 思维导图

向量(vector):重要
矩阵(Matrix)
数组(Array)
数据框(Data frame):重要
List

一、向量

向量
  • 1.标量和向量的区分

元素:可为数字或字符串
数字:1,2,3
字符串:s=“abcdefghij”,则s[1]=“a”,s[10]="j"
标量:一个元素组成的变量
向量:多个元素组成的变量
赋值:赋予这个变量一个数值(其实也不一定是数值,还可以是字符串/数据框等等)

赋值
  • 2.从向量中提取元素

(1)根据元素位置
(2)根据值的大小的

  • 根据元素位置

    下图应该说是元素,也有可能不是单纯的数值 提取
  • 根据数值大小
    a[a %in% c(1,2,3)] :存在于向量c(1,2,5)中的元素


    2

二、数据框

1、读取本地数据

**read.table(file = "huahua.txt",sep = "\t",header =T) **:读取文件,分隔符为Tab,有表头
a<-read.table(file = "huahua.txt",sep = "\t",header =T) :把这个数据框赋给一个变量a

开始时一直报错 报错
结果是因为这个软件每次开启时要重置工作目录 重置
终于好了,还是出错了
读取数据
把数据框赋给变量a 数据框赋值

2、设置行名和列名

  • 打开本地目录
  • colnames(X) :查看列名
  • rownames(X) :查看行名,默认值的行名就是行号,1.2.3.4...
  • colnames(X)[1]<-"bioplanet":有的公司返回数据,左上角第一格为空,R会自动补为x,用这个命令来修改
  • X<-read.csv(file = "huahua.txt",sep = "\t",header =T,row.names=1):最后row.names的意思是修改第一列为行名
打开目录
查看行列名
修改表头
第一列变为行名

3、数据框的导出

导出 更改后

4、变量的保存与重新加载

这次没有处理完的数据下次想接着用怎么办?
学会保存和重新加载。保存的格式是RData。

  • save.image(file="bioinfoplanet.RData"):保存当前所有变量
  • save(frame1,file="frame1.RData"):保存其中一个变量
  • load("frame1.RData"):再次使用RData时的加载命令
保存当前所有变量 保存所有变量
保存其中一个变量 单个变量保存
更改后
再次使用RData时的加载命令 再次加载

5、提取元素

提取元素

6、直接使用数据框中的变量

提取某两列作散点图:


image.png

其中case和value为某列的名称

散点图

相关文章

网友评论

    本文标题:生信小组DAY5-JANE

    本文链接:https://www.haomeiwen.com/subject/lcjndqtx.html