一、数据结构回顾
R中用于存储数据的形式即数据结构,包括向量(vector,文档4中已介绍);矩阵(matrix)、数组;数据框(dataframe)和列表(list) (记住各数据结构的英文,后面要用。数组了解概念就行)。
——本节详细内容可参考Robert I. Kabacoff《R语言实战(第2版) 》
二、数据结构
1数据框 (dataframe)
不同列可以包含不同模式(数值型、字符型等)的数据
#与通常在SAS、SPSS、Stata中看到的数据集类似。
矩阵创建函数为:data.frame()
特点:不同列可包含不同模式,同一列数据模式必须唯一。
data.frame()函数格式如下:
mydata<- data.frame(col1, col2, col3, ...)
解释:
mydata数据框名字<-data.frame(col1列向量, col2列向量, col3列向量, ...)
举例:
patientID <- c(1, 2, 3, 4)
age <-c(25, 34, 28, 52)
diabetes<-c("Type1", "Type2", "Type1", "Type1")
status<- c("Poor", "Improved", "Excellent", "Poor")
patientdata <-data.frame(patientID, age, diabetes, status)
patientdata
2 数据框中元素的引用 (即元素的提取)
同矩阵,不过这里新学习一个符号:使用$选定数据框中某个字段的数据
举例:
patientdata$age #选择了age这个字段的整列
#有时需要选择多个字段,但是每个字段都要输入$很麻烦
#所以可以用attach、detach、with简写代码,这里不详细介绍,下次遇到时见注释。
3 判断数据是否为数据框
is.data.frame()函数 #返回逻辑值
举例:
is.data.frame(status) #判断status是数据框吗?是就会返回TRUE,不是返回FALSE
is.data.frame(patientdata)#判断patientdata是数据框吗?
网友评论