美文网首页生信星球培训第四期
学习小组Day6笔记--郝志刚

学习小组Day6笔记--郝志刚

作者: 马连洼小法师 | 来源:发表于2018-09-08 17:08 被阅读23次

R语言学习

思维导图

1 获得学习小抄

tidyr包的小抄

2 tidyr包功能

(1)数据框的变形
(2)处理数据框中的空值
(3)根据一个表格衍生出其他表格
(4)实现行或列的分割和合并

用的数据处理成标准而统一的数据框(Tidy Data),才能进行进一步的数据处理和作图

3 安装tidyr包

3.1 下载和安装tydir:

install.packages("tidyr")

下载tidyr

3.2 加载tydir包:

library()

image.png

4 数据框

新建数据框(这里直接把新建的数据框赋值给了a)
a<data.frame(GeneId=rep("gene5",times=3),SampleName=paste("Sample",1:3,sep=""),Expression=c(14,19,18))

rep,重复,括号中填要重复的字符和重复次数。

paste,连接两个字符串,括号要填两个代连接字符并指定分隔符(sep),没有分隔符就填sep=“”。

image.png

5 认识Tidy Data

是一种组织表格数据的方式,提供了一种能够跨包使用的“统一”的数据格式。

5 .1 Reshape Data

准备数据


image.png

变形1

gather(a,X1999,X2000,key = "year",value = "cases")
gather括号里的分别是:
数据框名,需合并的列名(两个),合并后的key列名,value列名。

gather(a,year,cases,-country) #-country的意思就是合并除country外剩下的列。

5.2 Handle Missing Values

处理丢失的数据。就是某些单元格有空值的情况。

三种处理方式:
(1).删除整行
(2).根据上下文(瞎)蒙一个
(3).同一列的空值填上同一个数。

5.2.1 获取数据框X

导入:X<-read.csv('doudou.csv')
导出:write.csv(X,'doudou.csv')
drop_na():有空值的,整行删除掉
括号里填数据框名,依据的列名(有空值那一列的列名)

image.png

fill(),根据上一行的数值填充上

image.png

replace_na(),空值填进去特定的一个数值
括号里填数据框名,要填的列名=要填的值

image.png

5.3 Expand Tables

complete(把空值的位置补全)

image.png

expand列出每列值所有可能的组合

image.png

相关文章

网友评论

    本文标题:学习小组Day6笔记--郝志刚

    本文链接:https://www.haomeiwen.com/subject/bvflgftx.html