在R里面使用Rsubread完成组学分析全套流程

作者: 因地制宜的生信达人 | 来源:发表于2018-12-25 18:51 被阅读21次

在R里面使用Rsubread完成组学分析全套流程
持续好评的万金油科研！使用机器学习的方法做数据分析，做出合理的商
工欲善其事必先利其器之OkHttp解读
HI-C数据分析 pipeline（二：数据格式转换）
数据分析-现在是否还需要学习R语言
RNA-seq 详细教程：分析准备（3）
Android Library 中的资源 id 不是 final
如何写财务分析报告？全套财务分析报告模板（含分析方法及流程）
30天走完保险流程，有了满满的安全感
第一章

在R里面使用Rsubread完成组学分析全套流程

你是否害怕linux的黑白命令行操作，是否对去可视化畏畏缩缩，那么你会爱上它：Rsubread

这里演示一下传统的RNA-seq数据的表达量分析全流程, 安装Rsubread包后会有自带的测序数据如下：

-rw-r--r--  1 jmzeng  admin    25K Nov  9 18:04 longreads.txt.gz
-rw-r--r--  1 jmzeng  admin    80K Nov  9 18:04 reads.txt.gz
-rw-r--r--  1 jmzeng  admin    80K Nov  9 18:04 reads1.txt.gz
-rw-r--r--  1 jmzeng  admin    80K Nov  9 18:04 reads2.txt.gz
-rw-r--r--  1 jmzeng  admin    89K Nov  9 18:04 reference.fa

下面的分析流程也以此为例子，不过要切记，一旦切换到人类真实数据，下面的步骤都会耗时很可观，要有心理准备哈！

step1：构建索引

需要有参考基因组文件，这里使用Rsubread自带的数据作为例子：

library(Rsubread)
ref <- system.file("extdata","reference.fa",package="Rsubread")
buildindex(basename="reference_index",reference=ref)

step2：比对

需要有fastq格式的测序数据，还是使用Rsubread自带的数据作为例子：

## 首先是单端数据
reads <- system.file("extdata","reads.txt.gz",package="Rsubread")
align(index="reference_index",readfile1=reads,output_file="alignResults.BAM",phredOffset=64)

## 下面是双端
reads1 <- system.file("extdata","reads1.txt.gz",package="Rsubread")
reads2 <- system.file("extdata","reads2.txt.gz",package="Rsubread")
align(index="reference_index",readfile1=reads1,readfile2=reads2,
      output_file="alignResultsPE.BAM",phredOffset=64)

测试数据比对很迅速，也会同步输出bam文件到本地。

image

step3：定量

需要有基因组特征描述文件，通常是gtf格式的基因，转录本，外显子的染色体，起始终止坐标，这里还是使用测试数据，自己制作特征描述文件如下：

ann <- data.frame(
  GeneID=c("gene1","gene1","gene2","gene2"),
  Chr="chr_dummy",
  Start=c(100,1000,3000,5000),
  End=c(500,1800,4000,5500),
  Strand=c("+","+","-","-"),
  stringsAsFactors=FALSE)
ann
fc_SE <- featureCounts("alignResults.BAM",annot.ext=ann)
fc_SE


fc_PE <- featureCounts("alignResultsPE.BAM",annot.ext=ann,isPairedEnd=TRUE)
fc_PE

是不是很激动，这么简单就完成了NGS组学数据分析一条龙分析啊！！！

还有一些小细节

x <- qualityScores(filename=reads,offset=64,nreads=1000)
x[1:10,1:10]

propmapped("alignResults.BAM")

值得注意的是，你只是看了看这个包的用法而已，要想用得好，请听下回分解哦！

其它例子：http://combine-australia.github.io/RNAseq-R/07-rnaseq-day2.html

多组学分析一样

也有教程：https://www.bioconductor.org/help/course-materials/2015/EMBO/A01_RBiocForSequenceAnalysis.html

值得花10个小时学习的。

在R里面使用Rsubread完成组学分析全套流程
在R里面使用Rsubread完成组学分析全套流程你是否害怕linux的黑白命令行操作，是否对去可视化畏畏缩缩，那...
持续好评的万金油科研！使用机器学习的方法做数据分析，做出合理的商
“由于我在课题中的机器学习全程都是用R完成的，因此可以全面练习使用R语言进行全套的数据分析流程，包括：数据挖掘、清...
工欲善其事必先利其器之OkHttp解读
一、OKHttp的基本使用基本的使用流程如下二、使用流程源码分析同步请求流程分析异步请求流程分析这里与同...
HI-C数据分析 pipeline（二：数据格式转换）
由于HIC数据目前很难用一个软件就能将全套流程全部分析完，从数据预处理到后续的TAD计算，loop计算等需要用到众...
数据分析-现在是否还需要学习R语言
背景 R语言和Python语言都是广泛使用的数据分析工具。R语言在统计学和绘图方面有着更强的能力，而Python语...
RNA-seq 详细教程：分析准备（3）
学习目标了解 RNA-seq 和差异表达基因的分析流程了解如何设计实验了解如何使用 R 语言进行数据分析 1...
Android Library 中的资源 id 不是 final
【流程】ButterKnife 的说明中提到使用 R2 而非 R1StackOverflow：必须使用 R2 的...
如何写财务分析报告？全套财务分析报告模板（含分析方法及流程）
如何写财务分析报告？全套财务分析报告模板（含分析方法及流程），免费模板可领取。很多财务人员，会做账，会做各种报表...
30天走完保险流程，有了满满的安全感
从6月6日开始走保险分析流程，用了4天学完理论课程，其他的时间在私教铁铁老师和助教燕子师姐的协助下开始动手分析保单...
第一章
安装R和R简介 R简介 R是一款广泛使用的免费的统计学软件。可用其交互界面进行一些统计分析，也可进行简单编程。安...

在R里面使用Rsubread完成组学分析全套流程

在R里面使用Rsubread完成组学分析全套流程

step1：构建索引

step2：比对

step3：定量

多组学分析一样

相关文章

在R里面使用Rsubread完成组学分析全套流程

持续好评的万金油科研！使用机器学习的方法做数据分析，做出合理的商

工欲善其事必先利其器之OkHttp解读

HI-C数据分析 pipeline（二：数据格式转换）

数据分析-现在是否还需要学习R语言

RNA-seq 详细教程：分析准备（3）

Android Library 中的资源 id 不是 final

如何写财务分析报告？全套财务分析报告模板（含分析方法及流程）

30天走完保险流程，有了满满的安全感

第一章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

R语言做生信

生信分析流程

RNASeq 数据分析

生物信息学与算法

NGS