2021.4.12
持续更新中。。。
《R语言实战2》、学术数据分析及可视化
1. 数据类型
- 数值型
- 字符型(字符型都要加双/单引号)
- 逻辑型(T/F)
- 复数型
2. 数据结构
R中总共有5中数据结构,其中最小的数据结构是向量,最常用的数据结构是数据框。
2.1 向量
#创建
df <- c(1:100, 'a', '1')
#访问
df[2]
说明:
① 向量中个元素之间以逗号隔开
② 各个元素的类型要一致
③ i是下标,从1开始
2.2 矩阵
#创建
df <- matrix(1:100, nrow=25, byrow = T)
#访问第二行所有列
df[2,]
说明:
① 当数组维数为2时,是矩阵matrix()
② 各个元素的类型要一致
③ 默认是按照列排列,通过byrow = T
变成按行排列
④维数大于2时就是数组array()
2.3 数据框
#创建
patienID <- c(1, 2, 3, 4)
age <- c(25, 34, 28, 52)
diabetes <- c('Type1', 'Type1', 'Type2', 'Type1')
status <- c('Poor', 'Improved', 'Excellent', 'Poor')
patientdata <- data.frame(patientID, age, diabetes, status)
#访问列
pathentdata$age
说明:
① 数据框中可有多种数据形式,但是每一列的数据类型必须一致
2.4 因子
diabetes <- c('Type1', 'Type1', 'Type2', 'Type1')
diabetes <- factor(diatetes)
说明:
① 变量一般分为三种类型:名义型变量、有序型变量和连续型变量
②名义型变量指没有顺序之分的类别变量,有序型变量表示一种顺序关系而非数量关系,连续性变量就是一种数字关系
③一般数据不是数字的都是因子,它决定了数据的分析方式以及如何进行视觉呈现
2.5 列表
- 创建:
list()
- 访问:
mylist[["ages"]]
- 说明:可以包含多种数据结构
网友评论