Day 5 - Data structure

作者: 咚_e4c6 | 来源:发表于2020-03-17 22:14 被阅读0次

    LunaprimRose 2020.03.17

    Day 5.png

    Vector

    原子型向量就是最简单的包含数据的向量

    • R 中,最简单的对象类型叫做原子型向量(atomic vector)
    • R 中,可以将一组数据用 c 函数组合在一起,形成一个原子型向量
    die <- c(1,2,3,4,5,6)
    die
    [1] 1 2 3 4 5 6
    is.vector(die)    # is.vecrot 用来测试某个对象是否为原子型向量
    [1] TRUE
    
    • R 中,可以生成只含有一个值的原子型向量
    five <- 5
    five
    [1] 5
    is.vector(five)
    [1] TURE
    length(five)    # length 函数返回原子型向量的长度
    [1] 1
    
    • 每一个原子型向量都将其值存储在一个一维向量中,并且只能是一种类型的数据

      • 双整型 双整型向量用来存储普通的数值型数据
      die <- c(1,2,3,4,5,6)
      die
      [1] 1 2 3 4 5 6
      typeof(die)
      [1] "double"
      
      • 整型 整型向量用来存储整型的数据,不需要小数点成分
      int = c(-1L,2L,4L)
      int
      [1] -1 2 4
      typrof(int)
      [1] "interger"
      
      • 字符型 字符型向量存储一小段文本,字符型向量中的单个元素称作字符串(srting)
      text <- c("Hello","World")
      text
      [1] "Hello" "World"
      typeof(text)
      [1] "character"
      typeof("World")
      [1] "character"
      
      • 逻辑型 逻辑型向量用来存储 TRUE (真)和 FALSE (假),这是 R 中布尔数据的表现形式
      3 > 4
      [1] FALSE
      logic <- c(TRUE,FALSE,TRUE)
      logic
      [1] TRUE FALSE TRUE
      typeof(logic)
      [1] "logical"
      
      • 复数类型 复数类型向量用来存储复数
      comp <- c(1 + 1i,1 + 2i,1 + 3i)
      comp
      [1] 1+1i 1+2i 1+3i
      typeof(comp)
      [1] "complex"
      
      • 原始类型 原始类型向量用来存储数据的原始字节
      raw(3)
      [1] 00 00 00
      typeof(raw(3))
      [1] "raw"
      

    Data Frame

    数据框是列表的二维版本

    • 数据框将向量组织在一个二维的表格之中

    • 每一个向量都是这个表格中的一列

    • 数据框中的每一列都可以用来存储一种类型的数据

    • 列与列之间的数据类型可以不同

    • 每一列中的所有元素都必须是同一种类型的数据

    • 数据框中的每一列都必须具有相同的长度

    df <- data.frame(face = c("ace","two","six"),
      suit = c("clubs","clubs","clubs"),value = c(1,2,3))
    df
    face  suit value
    1  ace clubs     1
    2  two clubs     2
    3  six clubs     3
    

    Sign system of R

    可以通过 R 的记号体系来实现 R 对象中值的选取

    • 正整数索引 deck[i,j] 会返回 deck数据框中第 i 行第 j 列的元素
    head(deck)
       face   suit value
    1  king spades    13
    2 queen spades    12
    3  jack spades    11
    4   ten spades    10
    5  nine spades     9
    6 eight spades     8
    deck[1,1]
    [1] "king"
    
    • 要提取多个值,使用正整数向量代替单一整数作为索引
    deck[1,c(1,2,3)]
      face   suit value
    1 king spades    13
    
    • 如果在索引中重复某个数值,R 就会在相应的索引位置重复提取相应的数据,在最后的“数据子集”中重复出现
    deck[c(1,1),c(1,2,3)]
        face   suit value
    1   king spades    13
    1.1 king spades    13
    
    • 负整数索引 在索引时使用负整数返回的元素将不包括负整数索引所对应的元素
    deck[-(2:52),1:3]
        face   suit value
    1   king spades    13
    
    • 零索引 在索引时使用0会返回一个空的对象
    deck[0,0]
    data frame with 0 columns and 0 rows
    
    • 空格索引 使用空格索引提取该索引所代表维度的所有元素
    deck[1,]
      face   suit value
    1 king spades    13
    
    • 逻辑值索引 如果在索引时提供一个包含 TRUEFALSE 逻辑值的向量,会匹配索引值为 TRUE 的行位置(或者列)并提取出相应的元素,而忽略所有索引值为 FALSE 的行位置
    deck[1,c(TRUE,TRUE,FALSE)]
      face   suit
    1 king spades
    row <- c(TRUE,F,F,F,F,F)
    deck[row,]
      face   suit value
    1 king spades    13
    
    • 名称索引 被索引的对象由名称属性,可以采用待提取元素的名称作为索引值
    deck[1,c("face","suit","value")]
      face   suit value
    1 king spades    13
    deck[,"value"]
    [1] 13 12 11 10  9  8
    

    相关文章

      网友评论

        本文标题:Day 5 - Data structure

        本文链接:https://www.haomeiwen.com/subject/uszxyhtx.html