准备R包
方法1:去百度/谷歌XX小抄
方法2:
https://www.rstudio.com/resources/cheatsheets/
安装包裹-极简安包
1 Rstudio控制台输入library(tidyr),检查是否已经安装过
2-1安装过:congratulation!
2-2没安过:键入install.packages("tidyr")自动安装,再加载tidyr看一下
初步了解tidyr
它的功能主要有:
(1)数据框的变形
(2)处理数据框中的空值
(3)根据一个表格衍生出其他表格
(4)实现行或列的分割和合并
这个包是把你要用的数据处理成标准而统一的数据框(Tidy Data,下面有解释)
数据框的小常识
新建数据框Reshape Data
第一步建立数据
a<-data.frame(country=c("A","B","C"),"1999"=paste(c(0.7,37,212),"K"),"2000"=paste(c(2,80,213),"K"))
gather(a,"year","cases",X1999,X2000)
gather(a,X1999,X2000,key = "year",value = "cases")
gather(a,year,cases,-country)
排除法修改
Handle Missing Values
处理丢失的数据。就是某些单元格有空值的情况。
三种处理方式:
(1).删除整行
(2).根据上下文(瞎)蒙一个
(3).同一列的空值填上同一个数。
X<-read.csv('doudou.csv')导入数据
write.csv(X,'doudou.csv')导出数据
导入导出数据
删除空值行:
drop_na(X,X2)
删除空值行
根据上一行填空值:
fill(X,X2)
空值填特定值:
replace_na(X,list(X2=2))
Expand Tables
complete(把空值的位置补全)
complete(X,nesting(X1),fill = list(X2=5))
补全
expand
expand(pin2,GeneId,SampleName,Expression)
expand xmind
这两天学的太抽象了,,需要静心琢磨几个名词概念
网友评论