美文网首页
R语言基础教程 | 数据结构—数据框

R语言基础教程 | 数据结构—数据框

作者: 生信师姐 | 来源:发表于2021-06-11 08:46 被阅读0次

由于不同的列可以包含不同模式(数值型、字符型等)的数据,数据框的概念较矩阵来说更为一般。它与你通常在SAS、SPSS和Stata中看到的数据集类似。数据框将是你在R中最常处理的数据结构。

每一列数据的模式必须唯一,不过你却可以将多个模式的不同列放到一起组成数据框。由于数据框与分析人员通常设想的数据集的形态较为接近,我们在讨论数据框时将交替使用术语列和变量。

data.frame(data, row.names = NULL, check.rows = FALSE,
           check.names = TRUE, fix.empty.names = TRUE,
           stringsAsFactors = default.stringsAsFactors())

-data:参数的形式要么是value,要么是tag=value。基于标记(如果存在)或离开的参数本身创建组件名称。
-row.names:参数为NULL或单个整数或字符串,指定要用作行名称的列,或给出数据框行名称的字符或整数向量。
-check.rows:如果为真,则检查行长度和名称的一致性。
-check.names: 如果为真,则检查数据框中变量的名称,以确保它们是语法上有效的变量名称,并且不重复。如果有必要,可以(通过make.name)对它们进行调整。
-fix.empty.names:逻辑指示“未命名”的参数(在未被正式调用为someName = arg的意义上)是否得到自动构造的名称,或者更确切地说是名称“”。需要设置为FALSE,即使在检查时也是如此。
-stringsAsFactors:字符向量应该转换为因子吗?“factory-fresh”默认值为TRUE,但是可以通过设置选项来更改(stringsAsFactors = FALSE)。

一、数据框的创建

使用data.frame函数就可以初始化一个数据框。比如我们要初始化一个student的Data Frame其中包含ID和Name还有Gender以及Birthdate,那么代码为:

> Birthdate <-c("1984-12-29","1983-5-6","1986-8-8")
> Name <-c("Devin","Edward","Wenli")
> Gender <-c("M","M","F")
> ID <- c(11,12,13)
> student<-data.frame(ID,Gender,Name,Birthdate)
> student
  ID Gender   Name  Birthdate
1 11      M  Devin 1984-12-29
2 12      M Edward   1983-5-6
3 13      F  Wenli   1986-8-8

可用View()函数来查看数据框。

View(student)

二、数据框的一般操作

#查看它的维度
> dim(student) 
[1] 3 4

#只输出有列的个数
> length(student) 
[1] 4

#输出列名
> names(student) 
[1] "ID"        "Gender"    "Name"      "Birthdate"
> colnames(student) 
[1] "ID"        "Gender"    "Name"      "Birthdate"

#输出行名
> rownames(student) 
[1] "1" "2" "3"

> # R的数据框的元素选取和矩阵的元素选取很像, 唯一差别就是通过列名选取时,可以使用如下方式选取。
 #用$符号加上列名,获取该列数据
> student$ID 
[1] 11 12 13


> #由于Gender列是字符串,默认情况下转化为了因子,所以出现了Levels: F M
> student$Gender 
[1] M M F
Levels: F M

相关文章

网友评论

      本文标题:R语言基础教程 | 数据结构—数据框

      本文链接:https://www.haomeiwen.com/subject/veaseltx.html