学习小组Day6 笔记-R包入门（徐擎昱）

学习小组Day6 笔记-R包入门（徐擎昱）

作者: 徐擎昱 | 来源:发表于2018-11-24 07:22 被阅读23次

学习小组Day6 笔记-R包入门（徐擎昱）
学习小组Day6笔记--kan
学习小组Day2 笔记-Linux入门（徐擎昱）
学习小组Day4 笔记-R语言初上手（徐擎昱）
学习小组Day5 笔记-R语言语法（徐擎昱）
学习小组Day7笔记--Robin
学习小组DAY6——学习R包
学习小组Day6笔记--R包入门（李夕）
学习小组Day6笔记——R包
学习小组Day7 笔记-测序原理及分类（徐擎昱）

从tidyr包开始学起，准备工作：学会获取R包的小抄

1：百度/谷歌
2：https://www.rstudio.com/resources/cheatsheets/
3:学习小组的R包可在生信星球公众号回复相应名字。

tidyr包

该包可把数据处理成标准统一的数据框（Tidy data），方便下一步数据处理和作图。其功能包括：
（1）数据框的变形
（2）处理数据框中的空值
（3）根据一个表格衍生出其他表格
（4）实现行或列的分割和合并

常规数据结构：
每一列col：代表一个变量（variable）
每一行row：代表一次观测（observation）
Tidy Data的数据框结构：
每一列col：每个变量（variable）
每一行row：每个观测值（observation）的某种情况（case）

数据变形.png

安装R包

(1) 设置好工作目录（包会默认安装在工作目录里）
(2) 查询是否存在需要的包：library(tidyr)
(3) 下载和安装tidyr：install.packages("tidyr")，直到控制台出现>
(4). 安装成功后加载，没有报错就是成功：library(tidyr)

建立数据框，举例如下：

a <- data.frame(GeneId=rep("LOXL2",times=3),Samplename=paste("sample",1:3,sep=""),Expression=c(14,12,18))
#rep:重复函数，括号内为重复字符与次数
#paste:连接两个字符串，括号要填两个待连接字符并指定分隔符（sep），没有分隔符就填sep = "";拼接字符串函数：
#括号内行列名不用加引号，但是其他单元格中的字符串要加双引号
#数字作为行列名要加引号
#行raw
#列column，简化为col

数据变形

gather

新建原始数据框a：

a <- data.frame(Country = c("A","B","C"),"1999" = c("0.7K","37K","212K"),"2000" = c("2K","80K","213K")) 
#注意数字作为行列时需加引号

image.png

转换成TidyData：

gather(a,X1999,X2000,key="year",value="cases")
#括号内为数据框名，需合并的列名，合并后的key列名，value列名
#若需合并的列名较多，可用排除法进行合并：
gather(a,"year","cases",-country)
#括号内的key列名，value列名可直接写出，-Country表示合并除去Country的列

变形后的数据.png

变回来a<- spread(a,"year","cases")

处理丢失的数据，即某些单元格有空值的情况

导入数据
X <- read.csv('doudou.txt') #文档中“，”后存在空值，注意该文档要放在工作路径下

（1）删除整行

drop_na(数据框名，有空值的列名)，括号内不用加引号
X <- drop_na(X, X2)

（2）根据上下文蒙

fill(数据框名，有空值的列名),括号内不加引号-根据上一行的数值填充上
fill(X,X2)

（3）同一列的空值填上同一个数

replace_na(数据框名, list(列名 = 数值)) 函数，空值填进去特定的一个数值
X <- replace_na(X, list(X2 = 2))

complete()，把空值的位置补全
例如complete(X,nesting(X1),fill = list(X2=5))
即把空值用5填充上了

把一列拆成两列，原列必须有分隔符才能实现

拆分.png

合并.png
1.separate分割成两列
separate(数据框名,被拆分的列名,into,sep = c("列名1","列名2"))

2.separate_rows分割成两行
separate_rows(数据框名,被拆分的列名)

3.unite分割完了再合并
unite(数据框名,合并列名1,合并列名2,col = "新列名",sep = "")

参考和引用摘自生信星球第九期Day6生信入门班教程

相关文章

学习小组Day6 笔记-R包入门（徐擎昱）
从tidyr包开始学起，准备工作：学会获取R包的小抄 1：百度/谷歌2：https://www.rstudio.c...
学习小组Day6笔记--kan
笔记来自生信星球学习小组资料 Day6 学习内容-R包安装使用 1.思维导图镇楼 2.R包基本情况由社区开发（d...
学习小组Day2 笔记-Linux入门（徐擎昱）
今天开始linux的学习，先放思维导图下面是登陆成功后的界面思维导图上的基本命令使用一定要记住！ pwd 显示...
学习小组Day4 笔记-R语言初上手（徐擎昱）
事先已经安装了R和R-Studio，就不再重装，但把修改用户名为英文这项目记在这里，日后如果碰上类似的问题可以作为...
学习小组Day5 笔记-R语言语法（徐擎昱）
学R的时候没有做思维导图，只是列出目前已学的R语言语法，方便自己复制==，语法包括如下：建立Rstudy为工作路...
学习小组Day7笔记--Robin
学习笔记继续学习Day6的R
学习小组DAY6——学习R包
学习R包一、安装和加载R包 step1：镜像设置通过命令options()$repos检验RStudio的镜像，...
学习小组Day6笔记--R包入门（李夕）
R包说明书（cheatsheet），俗称小抄，除了今天跟着生信星球了解R包，还可以通过小抄了解。 R包入门之tid...
学习小组Day6笔记——R包
R包的使用利用代码安装与加载R包镜像设置安装：install.package("包") 加载：library...
学习小组Day7 笔记-测序原理及分类（徐擎昱）
基本名词flowcell：测序反应的载体/容器，1个flowcell有8个lanelane：测序反应的平行泳道...

网友评论

生信星球培训第九期

本文标题：学习小组Day6 笔记-R包入门（徐擎昱）

本文链接：https://www.haomeiwen.com/subject/bpkeqqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

生信星球培训第九期

热点阅读

生信星球培训第九期

关于我们|服务条款|联系我们|学习小组Day6 笔记-R包入门（徐擎昱）|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！