DAY6 R包学习——tidyr包安装与使用

DAY6 R包学习——tidyr包安装与使用

作者: 喜喜66 | 来源:发表于2019-03-11 08:52 被阅读34次

2019-01-19R包
DAY6 R包学习——tidyr包安装与使用
2022-04-27
学习小组Day6笔记--紧到长不帅
R语言tidyr包处理数据2021.3.6
学习小组Day6笔记--魏志辉
学习小组Day6笔记--kan
学习小组Day6笔记--林枫
R语言长短数据转换
学习小组Day 6笔记-K-molar

image.png

R包准备先知

R包（又叫小抄）的获取途径
方法1：去百度/谷歌XX小抄
方法2：找Rstudio的cheatsheet网站（网速好慢的）
tidyr介绍
R包里简单的，如下以此为例学会安装和使用。已从公众号下载该R包小抄pdf
功能主要有：
（1）数据框的变形
（2）处理数据框中的空值
（3）根据一个表格衍生出其他表格
（4）实现行或列的分割和合并
　　这个包是把你要用的数据处理成标准而统一的数据框（Tidy Data）
安装tidyr

进入Rstudio，按上节设置好工作目录
在控制台输入：library(tidyr),发现没有这个包，所以会报错
下载和安装tydir：install.packages("tidyr")
加载tydir：library(tidyr)

数据框的5点小常识

以下面命令为例，来看如何解读
a<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))

- 表达的意思是：新建数据框，这里直接把新建的数据框赋值给了a。括号里是“列名”=列值，这里列名要加双引号。
- rep，重复，括号中填要重复的字符和重复次数。paste，连接两个字符串，括号要填两个代连接字符并指定分隔符（sep），没有分隔符就填sep=“”。

key-valueg可理解为“键值对” ，表示一种对应关系。“键”和“值”都是列名
函数后面一般都要加括号，括号里第一个参数是都数据框名
字符串要加双引号（行名和列名也是字符串，但是可以不用加），其他单元格里出现的字符串要加
认识Tidy Data
图片引用自生信星球
“统一”：每个变量（variable）占一列，每个情况（case）和观测值（observation）占一行。
image.png

tidyr包使用（四大点）

一.Reshape Data
用于把数据框统一化
image.png

输入
a<-data.frame(country = c("A","B","C"),"1999" =paste(c(0.7,37,212),"K"),"2000" =paste(c(2,80,213),"K"))（特例：当列名是数字的时候，比如这里1999是字符变量，加双引号、单引号还是反引号（英文模式下的1前面那个键）都不报错！）
结果如下
同时数字列名前面加上个x(大写的)

image.png
如何将上述结果改为统一
使用gather函数：合并函数。基本格式是gather(数据框名，需合并的列名（两个），合并后的key列名，value列名)
此案例中gather(a,X1999,X2000,key = "year",value = "cases") 其中key=和value=也可以省略，即 gather(a,X1999,X2000,key = "year",value = "cases")
结果图如下，有warning也没事
image.png

二.Handle Missing Value
处理丢失的数据。就是某些单元格有空值的情况
image.png

首先用以下命令获得图示数据框X
X<-read.csv('doudou.txt')
补充csv的导入和导出方式。
导入：X<-read.csv('doudou.csv')
导出：write.csv(X,'doudou.csv')
Handle Missing Value有三种处理方式

- drop_na(数据框名，依据的列名（即有空值那一列的列名）),表示有空值的，整行删除掉。此处为drop_na(X,X2)
- fill(数据框名，依据的列名）)，表示根据上一行的数值填充上，此处为fill(X,X2)
- replace_na(数据框名，要填的列名=要填的值)，空值填进去特定的一个数值
  此处为replace_na(X,list(X2=2))
三.Expand Tables

image.png

complete函数
表示把空值的位置补全，此处为
complete(X,nesting(X1),fill=list(X2=5))，感觉和replace功能相近，只是complete函数，需要把列的信息也考虑进来（如此处的nesting(X1)）
expand函数
意思是列出每列值所有可能的组合

- 示例先建一个数据框
  pin2<-data.frame(GeneId = rep("gene5",times=3),SampleName =paste("Sample",1:3,sep=""),Expression=c(14,19,18))
  image.png
- 然后输入expand(pin2,GeneId,SampleName,Expression)
  image.png
四.split cells
图片引用自生信星球
表示把一列拆成两列（原列必须要有分隔符）

image.png
separate：按列分割
separate_rows：按行分割
image.png
unite：分割完了再合并回去

相关文章

2019-01-19R包
R包安装 R包小抄 tidyr包数据框常识
DAY6 R包学习——tidyr包安装与使用
R包准备先知 R包（又叫小抄）的获取途径方法1：去百度/谷歌XX小抄方法2：找Rstudio的cheatsheet...
2022-04-27
day6 R包的安装与使用——罗wb R包的安装镜像设置先运行file.edit('~/.Rprofile')...
学习小组Day6笔记--紧到长不帅
今天学习第六天，今天的内容是R语言中的tidyr包首先是安装tidyr包：install.packages("t...
R语言tidyr包处理数据2021.3.6
1. tidyr包安装与载入 2. tidyr包中函数的使用函数很多，作用对象是数据框 2.1 gather函数...
学习小组Day6笔记--魏志辉
学习内容第一个R包--tidyr 准备工作 1 . 获取一个R包的小抄 2 . 初步了解tidyr 3 . 学习...
学习小组Day6笔记--kan
笔记来自生信星球学习小组资料 Day6 学习内容-R包安装使用 1.思维导图镇楼 2.R包基本情况由社区开发（d...
学习小组Day6笔记--林枫
思维导图 part1：学会获取一个R包的小抄 part2：初步了解tidyr part3：学习极简安装R包
R语言长短数据转换
R数据格式转换tidyr包：reshape2的替代者，功能更纯粹R 学习笔记：tidyr 包整理数据的利器 gat...
学习小组Day 6笔记-K-molar
一、初步认识tidyr包 1.首先安装tidyr包 2.初步了解tidyr包的知识必应搜索tidyr，找到相关介...

网友评论

本文标题：DAY6 R包学习——tidyr包安装与使用

本文链接：https://www.haomeiwen.com/subject/daempqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

生信星球培训第十三期

R语言做生信

R语言与统计分析

热点阅读

生信星球培训第十三期

R语言做生信

Cook R

R语言与统计分析

关于我们|服务条款|联系我们|DAY6 R包学习——tidyr包安装与使用|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！