美文网首页
R语言数据集

R语言数据集

作者: 孔嘉豪 | 来源:发表于2021-05-31 12:11 被阅读0次
    数据集通常是由数据构成的一个矩形数组,“行”表示观测(observation),“列”表示变量(variable) R语言数据结构

1. 向量 Vector
    向量是用于储存数值型、字符型或逻辑型数据的一维数组。执行组合功能能的函数\color{red}{c()}可用来创建向量。

  • 数值型向量:a <- c(1,2,5,3,6,-2,4)
  • 字符型向量:b <- c("one","two","three")
  • 逻辑性向量:c <- c(Ture,FALSE,T,F)

\color{red}{★Attention}单个向量中的数据必须拥有相同的类型或模式(即数值型、字符型或逻辑型)。同一向量中无法混杂不同模式的数据。

a <- c("US", "UK", "CHINA", "FRANCE", "GERMANY", "RUSSIA")
a 
a[3] #提取a的第3个数值
a[c(1, 3, 5)] #提取a中第1、3、5的数值
a[3:6] #提取a中第3至6的数值
a <- c(2:6) #创建含有2至6的数值型向量,并对a赋值
a 

2. 矩阵 Matrix
    矩阵是一个二维数组,知识每个元素都拥有相同的模式(数值型、字符型或逻辑型)。可通过函数\color{red}{matrix()}创建矩阵。

x <- matrix(1:20, nrow=5, ncol=4, byrow=T) #按行填充
x
x[2,] #提前第2行
x[,3] #提前第3列
x[2,3] #提前第2行第3列的元素
#给行和列添加名称
rowname <- c("R1", "R2", "R3", "R4", "R5")
colname <- c("C1", "C2", "C3", "C4")
y <- matrix(1:20, nrow=5, ncol=4, byrow=F, dimnames=list(rowname, colname)) #按列填充
y
y[2,] #提取第2行
y[,3] #提取第3列
y[2,3] #提取第2行第3列的元素

3. 数组 Array
    数组与矩阵类似,但是维度可以大于2。数组可通过\color{red}{array()}函数创建。
    数组是矩阵的一个自然推广。它们在编写新的统计方法时很有用。像矩阵一样,数组中的数据也只能拥有一种模式。从数组中选取元素的方法与矩阵相同。

dim1 <- c("A1", "A2")
dim2 <- c("B1", "B2", "B3")
dim3 <- c("C1", "C2", "C3", "C4")
z <- array(1:24, c(2,3,4), dimnames=list(dim1, dim2, dim3)) #创建三维(2×3×4)数值型数组
z

4. 数据框 Data Frame
    这是R语言最常用的数据类型。不同的列可以包含不同模式的数据。每一列数据的模式必须相同,且必须等长。数据框可通过函数\color{red}{data.frame()}创建。

patientID <- c(1, 2, 3, 4)
age <- c(25, 34, 28, 52)
diabetes <- c("Type1", "Type2", "Type1", "Type1")
status <- c("Poor", "Improved", "Excellent", "Poor")
demodata <- data.frame(patientID, age, diabetes, status)
demodata
View(demodata)
demodata[,1:2] #提取1-2列
demodata[c("patientID","age")]
demodata$age #提取某个特定变量
table(demodata$diabetes, demodata$status) #生成列联表

5. 列表 List
    列表是一些对象(或成分)的有序集合。列表允许你整合若干(可能无关的)对象到单个对象名下。例如,某个列表中可能是若干向量、矩阵、数据框,甚至其他列表的组合。可以使用函数\color{red}{list()}创建列表。
    许多R的运行结果都是以列表的形式返回的。需要取出其中哪些成分由分析人员决定。

a <- "My List"
b <- c(25, 26, 18, 39)
c <- matrix(1:10, nrow=5)
d <- c("one", "two", "three")
list <- list(title=a, age=b, c, d)
list
#提取某个成分
list[["age"]]
list[[3]]

相关文章

  • 机器学习算法实现(三):SVM

    SVM算法的R语言实践 数据集,采用R语言内置的iris数据集。 查看数据集前六个观测 head(iris) 第一...

  • K近邻法的R语言简单实现(knn)

    K近邻法的R语言简单实现(knn) 数据集采用R语言内置iris 查看数据集前6个观测 k近邻法1.数据集分为训练...

  • 机器学习算法实现(十):Apriori

    Apriori算法R语言实践 数据集 采用arules包中的Adult数据集。 Adult数据集属于事务型数据集。...

  • R语言基础之第五部分 总结数据信息

    R语言基础之第五部分 总结数据信息 1、以R自带数据集airquality为例 2、以R自带数据集Titanic为...

  • R语言数据集

        数据集通常是由数据构成的一个矩形数组,“行”表示观测(observation),“列”表示变量(varia...

  • DAY5-luke

    R语言画图 如:1.打开R 语言软件,导入数据集data,data<-read.csv("D:/time.csv"...

  • 最简单的GEO分析

    GEO 数据集的差异分析语言:R差异分析包:limma前提:GSE数据集内有数据,GPL数据有数据“Series ...

  • dplyr包笔记

    dplyr包是R语言数据处理的神器,这里记录一点刚学到的东西。 以下操作基于R语言自带数据集"mtcars". 变...

  • 创建R的数据格式

    R软件自带了很多数据集(data set),并附有这些数据集的分析和绘图示例,可在学习R语言时使用。用data()...

  • R语言日常笔记(2)distinc函数

    接上文:R语言日常笔记(1)filter函数 所使用的数据集是starwars数据集 本文将会接受如何数据框处理的...

网友评论

      本文标题:R语言数据集

      本文链接:https://www.haomeiwen.com/subject/gthvsltx.html