学习小组DAY5-振华

作者: 振华_9c1a | 来源:发表于2022-04-26 21:22 被阅读0次

数据结构

数据集

通常是由数据构成的一个矩形数组,行表示观测,列表示变量。R中有许多存储数据的结构,包括标量、向量、数组、数据框和列表,多样化的列表赋予R极其灵活的数据处理能力。

向量
  • 向量是用于存储数值型、字符型或逻辑型数据的一维数组。a为数值型向量,b为字符型向量,c为逻辑型向量,单个向量中的数据必须拥有相同的类型和模式。
> a <- c(1,2,5,3,6,-2,4)
> b <- c("one","two","three")
> c <- c(TRUE,TRUE,TRUE,FALSE,TRUE,FALSE)
  • 通过在方括号中给定元素所处位置的数值,我们可以提取向量中的元素
> a <- c("k","g","h","a","c","m")
> a[3]   第三个元素
[1] "h"
> a [c(1,3,5)]
[1] "k" "h" "c" 第1,3,5个元素
> a[2:6]
[1] "g" "h" "a" "c" "m" 第2~6个元素
> a [-3]
[1] "k" "g" "a" "c" "m" 除了第3个元素

也可通过值的大小提取元素

> a <- c(1,2,5,3,6,-2,4)
> a[a<2]
[1]  1 -2
> a[a==2]
[1] 2
> a[a %in% c(1,2,5,3,6,-2,4)]
[1]  1  2  5  3  6 -2  4

数据框
  • 不同的列包含不同的模式(数值型、字符型等)的数据。数据框可通过data.frame?()创建
> patientID <- c(1,2,3,4)
> age <- c(25,34,28,52)
> diabates <- c("Type1","Type2","Type1","Type1")
> status <- c("poor","Improve","Excellent","poor")
> patientdata <- data.frame(patientID,age,diabates,status)
> patientdata <- data.frame(patientID, age, diabates, status)
> patientdata
  patientID age diabates    status
1         1  25    Type1      poor
2         2  34    Type2   Improve
3         3  28    Type1 Excellent
4         4  52    Type1      poor
  • 选取数据框中的元素
数据导入
  • 使用read.table()从文本文件中导入数据。此函数可读入一个表格格式的文件并将其保存为一个数据框。
  • 逗号分隔文件(.csv文件)、制表符分隔文件(.tsv文件)和空格分隔文件(.txt文件)
  • 读取本地数据,read.table(file="huahua.txt",sep = "\t",header = T)
  • 函数选项
    • header 表示文件是否第一行包含了变量名的逻辑型变量
    • sep 分开数据值的的分隔符
    • row.names 用于指定一个或多个行标记符的可选参数
    • col.names 如果数据文件的第一行不包括变量名,可以用col.names去指定一个包含变量名的字符向量。
    • X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1),修改第一列为行名
    • write.table(X,file = "yu.txt",sep = ",",quote=F)数据导出
    • save.image(file="bioinfoplanet.RData")保存当前所有变量
    • save(X,file="test.RData")保存其中一个变量
    • load("test.RData")再次使用RData时的加载命令```
  • 把文本文件存放在工作目录下不然会报错
提取元素
  • [x,y]第x行第y列
  • [x,]第x行
  • [,y]第y列
  • x[y]也是第y列
  • [a:b]第a列到第b列
  • [c(a,b)]第a列和第b列

save(X,file="test.RData")这句代码如果报错object X not found,是为什么,应该怎么解决?

  • 第一种可能是不存在,第二种保存时可能输入法不对,大小写或者中文输入法,改写大小写。

相关文章

  • 学习小组DAY5-振华

    数据结构 数据集 通常是由数据构成的一个矩形数组,行表示观测,列表示变量。R中有许多存储数据的结构,包括标量、向量...

  • 学习小组DAY4-振华

    R语言 什么是R语言 一个能够有效地用于统计计算和绘图的语言和环境,它提供了广泛的统计分析和绘图技术。 安装的软件...

  • 学习小组DAY7-振华

    测序知识 来个开场白 今天是小组最后一天啦,有多多的不舍......谢谢花花老师引导让我入门了生信,原本看着高深莫...

  • 学习小组Day5-杨帆

    羞耻地来补作业了…… 主要内容记录在思维导图里,以下主要记载一些收获和疑惑。 向量 向量和标量最大的区别在于向量由...

  • 学习小组Day5-叶子

    文/叶子 以下内容均来自生信星球,本节课思维导图如下: 一、向量 1.标量和向量的区分 标量:一个元素组成的变量向...

  • 学习小组Day5-牙牙

    直接上笔记向量

  • DAY5-谢荣俊

    学习的第五天,下午的外教课放学的早,赶紧回来刷课打卡。 生信星球学习小组第87期DAY5-数据结构 思维导图 谢荣...

  • 学习小组笔记DAY6--振华

    package处理数据 镜像设置 R的包主要来源于CRAN网站和Biocductor,生信主要来源于Biochuc...

  • 学习小组Day5-萌翻

    学习生信的第五天,今天进一步学习了R语言,每天都能学到新知识真的好开心!! 首先,梳理一下关于学习R语言的几个易错...

  • 学习小组Day5-格帆

    数据类型 Part1 向量 1.标量和向量的区分 标量:一个元素组成的变量向量:多个元素组成的变量 2.变量赋值:...

网友评论

    本文标题:学习小组DAY5-振华

    本文链接:https://www.haomeiwen.com/subject/lrvhyrtx.html