美文网首页生信星球培训第七期
学习小组Day6笔记--慧美

学习小组Day6笔记--慧美

作者: 慧美huimei | 来源:发表于2018-10-13 22:01 被阅读24次

    一、思维导图

    思维导图

    二、准备工作

    1. 获取R包小抄(cheatsheet)
      去百度/谷歌XX小抄
      找Rstudio的cheatsheet网站
      教程里用到的包都可以到生信星球公众号回复相应的包名来获取

    2. 初步了解tidyr

    • 安装R包
    • 新建数据框(这里直接把新建的数据框赋值给了a)
    a<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
    
    • 认识Tidy Data
      每个变量(variable)占一列,每个情况(case,姑且这么翻译)和观测值(observation)占一行。
    • 1.Reshape Data
      gather
      spread
    • 2.Handle Missing Values

    三种处理方式:
    (1).删除整行
    (2).根据上下文(瞎)蒙一个
    (3).同一列的空值填上同一个数。

    X<-read.csv('doudou.txt')
    

    导入:X<-read.csv('doudou.csv')
    导出:write.csv(X,'doudou.csv')
    drop_na():有空值的,整行删除掉
    括号里填数据框名,依据的列名(有空值那一列的列名)
    fill(),根据上一行的数值填充上
    replace_na(),空值填进去特定的一个数值
    complete(把空值的位置补全)
    expand(列出每列值所有可能的组合)
    separate:按列分割
    separate_rows:按行分割
    unite:分割完了再合并回去

    相关文章

      网友评论

        本文标题:学习小组Day6笔记--慧美

        本文链接:https://www.haomeiwen.com/subject/vhsaaftx.html