美文网首页R语言知识干货
R语言与生信应用10-R语法-因子factor和缺失值

R语言与生信应用10-R语法-因子factor和缺失值

作者: BioSi | 来源:发表于2019-04-27 22:30 被阅读110次

    因子Factors

    因子用来表示数据分组,可以有序或无序。因子可以视作带标签label的整型向量。

    • 因子可通过模型函数lm()glm()创建
    • 使用标签的因子分组比使用数据更直观,“Male”和“Female”分组比1和2分组更易于理解

    > x <- factor(c("yes", "yes", "no", "yes", "no")) 
    > x
    [1] yes yes no yes no
    Levels: no yes
    > table(x) 
    x
    no yes 
     2   3
    > unclass(x)
    [1] 2 2 1 2 1
    attr(,"levels")
    [1] "no"  "yes"
    

    水平的先后顺序可以使用factor()函数的levels参数来指定。这在线性模型中很重要,因为第一个水平常被用来作为对照。

    > x <- factor(c("yes", "yes", "no", "yes", "no"),
                  levels = c("yes", "no"))
    > x
    [1] yes yes no yes no 
    Levels: yes no
    

    缺失值Missing Values

    缺失值NANaN代表未定义的数学操作。

    • is.na()函数用来测试R对象是否为NA
    • is.nan()函数用来测试R对象是否为NaN
    • NA值也有数据类型,整型NA, 字符串character NA等等
    • NaN值属于NA

    > x <- c(1, 2, NA, 10, 3)
    > is.na(x)
    [1] FALSE FALSE  TRUE FALSE FALSE
    > is.nan(x)
    [1] FALSE FALSE FALSE FALSE FALSE
    > x <- c(1, 2, NaN, NA, 4)
    > is.na(x)
    [1] FALSE FALSE  TRUE  TRUE FALSE
    > is.nan(x)
    [1] FALSE FALSE  TRUE FALSE FALSE
    

    课程分享
    生信技能树全球公益巡讲
    https://mp.weixin.qq.com/s/E9ykuIbc-2Ja9HOY0bn_6g
    B站公益74小时生信工程师教学视频合辑
    https://mp.weixin.qq.com/s/IyFK7l_WBAiUgqQi8O7Hxw
    招学徒:
    https://mp.weixin.qq.com/s/KgbilzXnFjbKKunuw7NVfw

    相关文章

      网友评论

        本文标题:R语言与生信应用10-R语法-因子factor和缺失值

        本文链接:https://www.haomeiwen.com/subject/bqmcnqtx.html