Day 5 - Data structure

作者: 咚_e4c6 | 来源:发表于2020-03-17 22:14 被阅读0次

LunaprimRose 2020.03.17

Day 5.png

Vector

原子型向量就是最简单的包含数据的向量

  • R 中,最简单的对象类型叫做原子型向量(atomic vector)
  • R 中,可以将一组数据用 c 函数组合在一起,形成一个原子型向量
die <- c(1,2,3,4,5,6)
die
[1] 1 2 3 4 5 6
is.vector(die)    # is.vecrot 用来测试某个对象是否为原子型向量
[1] TRUE
  • R 中,可以生成只含有一个值的原子型向量
five <- 5
five
[1] 5
is.vector(five)
[1] TURE
length(five)    # length 函数返回原子型向量的长度
[1] 1
  • 每一个原子型向量都将其值存储在一个一维向量中,并且只能是一种类型的数据

    • 双整型 双整型向量用来存储普通的数值型数据
    die <- c(1,2,3,4,5,6)
    die
    [1] 1 2 3 4 5 6
    typeof(die)
    [1] "double"
    
    • 整型 整型向量用来存储整型的数据,不需要小数点成分
    int = c(-1L,2L,4L)
    int
    [1] -1 2 4
    typrof(int)
    [1] "interger"
    
    • 字符型 字符型向量存储一小段文本,字符型向量中的单个元素称作字符串(srting)
    text <- c("Hello","World")
    text
    [1] "Hello" "World"
    typeof(text)
    [1] "character"
    typeof("World")
    [1] "character"
    
    • 逻辑型 逻辑型向量用来存储 TRUE (真)和 FALSE (假),这是 R 中布尔数据的表现形式
    3 > 4
    [1] FALSE
    logic <- c(TRUE,FALSE,TRUE)
    logic
    [1] TRUE FALSE TRUE
    typeof(logic)
    [1] "logical"
    
    • 复数类型 复数类型向量用来存储复数
    comp <- c(1 + 1i,1 + 2i,1 + 3i)
    comp
    [1] 1+1i 1+2i 1+3i
    typeof(comp)
    [1] "complex"
    
    • 原始类型 原始类型向量用来存储数据的原始字节
    raw(3)
    [1] 00 00 00
    typeof(raw(3))
    [1] "raw"
    

Data Frame

数据框是列表的二维版本

  • 数据框将向量组织在一个二维的表格之中

  • 每一个向量都是这个表格中的一列

  • 数据框中的每一列都可以用来存储一种类型的数据

  • 列与列之间的数据类型可以不同

  • 每一列中的所有元素都必须是同一种类型的数据

  • 数据框中的每一列都必须具有相同的长度

df <- data.frame(face = c("ace","two","six"),
  suit = c("clubs","clubs","clubs"),value = c(1,2,3))
df
face  suit value
1  ace clubs     1
2  two clubs     2
3  six clubs     3

Sign system of R

可以通过 R 的记号体系来实现 R 对象中值的选取

  • 正整数索引 deck[i,j] 会返回 deck数据框中第 i 行第 j 列的元素
head(deck)
   face   suit value
1  king spades    13
2 queen spades    12
3  jack spades    11
4   ten spades    10
5  nine spades     9
6 eight spades     8
deck[1,1]
[1] "king"
  • 要提取多个值,使用正整数向量代替单一整数作为索引
deck[1,c(1,2,3)]
  face   suit value
1 king spades    13
  • 如果在索引中重复某个数值,R 就会在相应的索引位置重复提取相应的数据,在最后的“数据子集”中重复出现
deck[c(1,1),c(1,2,3)]
    face   suit value
1   king spades    13
1.1 king spades    13
  • 负整数索引 在索引时使用负整数返回的元素将不包括负整数索引所对应的元素
deck[-(2:52),1:3]
    face   suit value
1   king spades    13
  • 零索引 在索引时使用0会返回一个空的对象
deck[0,0]
data frame with 0 columns and 0 rows
  • 空格索引 使用空格索引提取该索引所代表维度的所有元素
deck[1,]
  face   suit value
1 king spades    13
  • 逻辑值索引 如果在索引时提供一个包含 TRUEFALSE 逻辑值的向量,会匹配索引值为 TRUE 的行位置(或者列)并提取出相应的元素,而忽略所有索引值为 FALSE 的行位置
deck[1,c(TRUE,TRUE,FALSE)]
  face   suit
1 king spades
row <- c(TRUE,F,F,F,F,F)
deck[row,]
  face   suit value
1 king spades    13
  • 名称索引 被索引的对象由名称属性,可以采用待提取元素的名称作为索引值
deck[1,c("face","suit","value")]
  face   suit value
1 king spades    13
deck[,"value"]
[1] 13 12 11 10  9  8

相关文章

网友评论

    本文标题:Day 5 - Data structure

    本文链接:https://www.haomeiwen.com/subject/uszxyhtx.html