转录组分析流程

作者: 看远方的星 | 来源:发表于2019-11-18 22:22 被阅读0次

概念及类型:

  • 转录组(transcriptome)广义上指某一生理条件下,细胞内所有转录产物的集合,包括信使RNA核糖体RNA转运RNA非编码RNA;狭义上指所有mRNA的集合。

  • 转录组测序分析可以分为有参转录组分析和无参转录组分析。有参无参的意思是,有/无参考基因组。

1、有参转录组分析流程:

有参转录组分析流程.png
2、无参转录组分析流程:
Snipaste_2019-09-11_09-32-27.png
clean reads :为确保Reads有足够高的质量,将下机原始测序数据(raw reads)去掉含有带接头的、低质量的reads,得到clean reads,保证后续分析的准确性。
unigene:针对无参考基因组的物种,将小片段拼接出unigene,构建参考序列,以便后续分析,是研究无参物种分子机制与调控网络的有效手段。

三种转录组分析模式

基于研究物种是否有参考基因组,实验目的上是否需要分析新的转录本,转录组测序的分析模式大致可以分成3种类型,如下图:


553.jpg

一、有参,需要分析新转录本
部分有参考基因组的物种,由于注释信息不够完善,或需要分析一些非编码RNA,这时需要基于Reads与基因组比对信息对转录组进行组装,以期获得新的转录本来让分析结果更加完备。

这也是有参物种做转录组最常用的分析模式,其分析步骤如下:

  1. Reads与基因组比对

  2. 基于比对信息组装转录本

  3. 基因或转录本表达定量

  4. 差异分析和功能富集分析

二、有参,只分析已知转录本
针对参考基因组注释信息较为详细的物种,比如人,小鼠,拟南芥等模式生物,同时您的实验目的很明确,就是分析已知的基因或转录本,那就可以直接基于基因组注释信息中提取出的转录本序列来进行后续分析。该分析模式分析流程简单、速度快,其具体分析步骤如下:

  1. Reads与转录本序列进行比对

  2. 转录本表达定量

  3. 差异分析和功能富集分析

三、无参考基因组的转录组
而对于没有参考基因组的物种,或者基因组组装不好的物种,必须先使用测序数据组装一套转录本,再基于转录本进行后续分析。其分析步骤如下:

  1. Reads De novo组装转录本序列

  2. Reads 回比组装好的转录本序列

  3. 转录本表达定量

  4. 差异表达分析和功能分析


other:


image.png
image.png
image.png

怎么做无参转录组分析?


如下图1所示,在做转录组分析时,除了需要reads等原始数据外,还需要一系列的注释文件。然而,当我们的研究物种没有参考基因组但需要做转录组分析时,便不能通过以上流程获得我们需要的分析结果。


图1-有参转录组分析流程

此时,我们可以通过拼接reads数据获得转录本,该转录本用于后续reads比对。再将该拼接好的转录本与各大蛋白数据库注释,其中常用的数据库有NR、NT、Swiss-Prot、KEGG、COG、GO等。获得该注释结果后,我们便对该物种的蛋白信息有一个比较清楚的了解,可以进行后续的转录组分析流程。

最常使用的组装软件为Trinity,运行该软件时,主要分三部分运行,依次为Inchworm、Chrysalis和Butterfly(下图2)。


图 2 Trinity组装流程简图

运行Inchworm时,其目的是将每条短读长的reads打断成固定长度的Kmer(默认为25 bp)形成一个Kmer库,再将所有Kmer按其出现的次数进行排序,选择出现次数最高的Kmer进行3端延伸一个碱基(A、T、G、C),延伸后统计靠近3端25bp的Kmer在库中出现的次数,选择次数最高的那条路径(如有多条路径出现的次数一样,则几条路径保留),继续向3端延伸至不能延伸为止。同理进行5端延伸,最终形成一定长度的Contigs。

每形成一个Contigs时,将形成该Contigs的kmer从Kmer库中去除掉,继续选择次数最高的Kmer进行延伸。最终用完Kmer库中的Kmer,将Contigs放在一起形成一个contigs库。运行Chrysalis时,对Contigs库中的Contigs按照一定条件进行聚类,之后对每类Contigs构建de bruijin graphs。

最后运行Butterfly,解析上一步构建的de bruijin graphs,形成转录本。将所有转录本输出到一个文件,便是最Trinity终组装的文件,其格式如图3所示。


图 3 Trinity组装的转录本格式

获得拼接后的转录本后,便可以按照Trinity官网中的说明,进行注释和下游分析,其流程如图4所示。


图 4 Trinity官网中的分析流程

参考文章:

易基因-无参转录组分析流程

相关文章

  • 转录组测序—数据分析与解读

    流程概览 转录组测序的分析流程大致可以分成三类,包括基因组比对(Genome mapping)、转录组比对(Tra...

  • 转录组测序(2018-05-28)

    原文来自:聊聊转录组测序——2.数据分析与解读(上) 流程概览 转录组测序的分析流程大致可以分成三类,包括基因组比...

  • RNA-seq名词解释(8)

    (十)、分析流程及软件列表 有参转录组:针对有参考基因组序列的物种进行 mRNA 的分析。 无参转录组:针对尚无参...

  • 10X空间转录组WORKFLOW

    记得我们在ST Pipeline||空间转录组分析流程讲过,空间转录组就是把之前的单细胞的cell-gene矩阵转...

  • 【微信归档】转录组学习笔记

    目前已经实战两个转录组(小鼠和植物)项目,大概对转录组的分析流程有了进一步的了解。 归档文章 【PPT】文献报告-...

  • RNAseq 分析后 R 结果可视化volcano plot和h

    这个文章跟着之前的文章完整转录组RNAseq分析流程(tophat2+cufflink+cuffdiff)用了之前...

  • 转录组数据分析

    转录组分析基本流程 总体流程 测序的原始数据下载-----数据的过滤和质控(fastp)----下载参考基因组序列...

  • 生信菜鸟团-专题学习目录

    生信菜鸟团-专题学习目录 原文链接 转录组专题 转录组专题-可变剪接转录组专题-融合基因转录组专题-WGCNA分析...

  • 全长转录组分析-小麦

    前言 近期分析了一部分小麦的全长转录组数据,参考了网上许多流程,收获良多,在此记录一下 全长转录组测序基于PacB...

  • 使用fusioncatcher进行融合基因的分析

    欢迎关注”生信修炼手册”! 在某篇评估转录组各个分析流程所用软件的文章中,fusioncatcher 被评为分析融...

网友评论

    本文标题:转录组分析流程

    本文链接:https://www.haomeiwen.com/subject/xiriyctx.html