RNAseq教程(4.1)

作者: 周小钊 | 来源:发表于2021-01-11 21:14 被阅读0次

    1.Module 1 - Introduction to RNA sequencing

    1. Installation
    2. Reference Genomes
    3. Annotations
    4. Indexing
    5. RNA-seq Data
    6. Pre-Alignment QC

    2.Module 2 - RNA-seq Alignment and Visualization

    1. Adapter Trim
    2. Alignment
    3. IGV
    4. Alignment Visualization
    5. Alignment QC

    3.Module 3 - Expression and Differential Expression

    1. Expression
    2. Differential Expression
    3. DE Visualization
    4. Kallisto for Reference-Free Abundance Estimation

    4.Module 4 - Isoform Discovery and Alternative Expression

    1. Reference Guided Transcript Assembly
    2. de novo Transcript Assembly
    3. Transcript Assembly Merge
    4. Differential Splicing
    5. Splicing Visualization

    5.Module 5 - De novo transcript reconstruction

    1. De novo RNA-Seq Assembly and Analysis Using Trinity

    6.Module 6 - Functional Annotation of Transcripts

    1. Functional Annotation of Assembled Transcripts Using Trinotate

    4.1 Reference Guided Transcript Assembly

    利用Stringle和Ballgown发现从头组装的转录本和差异表达

    在上一个模块中,使用Stringtie的'-G'和'-e' 选项在'reference only'模式下运行Stringtie。

    在本模块中,我们将以另外两种模式运行Stringtie:“reference guided”模式及(2)“de novo”模式。在已知转录本的帮助下,Stringtie可以预测每个文库中存在的转录本。然后,Stringtie将为每个由数据组装的转录本分配任意的转录本id,并估计这些转录本的表达。这种方法的一个复杂之处在于,在每个库中,都可能预测出一组不同的转录本。可能有很多相似之处,但是在每个库的输出文件中,转录的数量和它们的确切结构是不同的。因此,在跨库进行比较之前,需要确定哪些转录本在跨库之间相互对应。Stringtie提供了一个merge命令来组合来自不同库的预测文本GTF文件。

    一旦有了一个合并的GTF文件,就可以用它来运行Stringtie,而不是我们以前使用的已知的transcripts GTF文件。合并的GTF被用来重新计算表达估计在准备运行Ballgown使用合并新转录本。

    To run Stringtie in 'reference guided' mode: use the '-G' option WITHOUT '-e'

    To run Stringtie in 'de novo' mode do NOT specify either of the '-G' OR '-e' options.

    参考Stringtie手册获得更详细的说明:https://ccb.jhu.edu/software/stringtie/index.shtml?t=manual

    Running Stringtie in Reference Guided Mode

    使用我们在前面模块中生成的对齐,现在只使用'-G'选项在reference guided模式下运行Stringtie。

    额外选项如下

    • '-p 8' tells Stringtie to use eight CPUs
    • '-G ' reference annotation to use for guiding the assembly process (GTF/GFF3)
    • '-l' name prefix for output transcripts (default: STRG)
    • '-o' output path/file name for the assembled transcripts GTF (default: stdout)

    首先,创建一个输出目录,然后以reference guided模式运行stringtie。

    mkdir ref_guided
    stringtie -p 1 -G ../chr22_with_ERCC92.gtf -l HBR_Rep1 -o ref_guided/HBR_Rep1/transcripts.gtf HBR_Rep1.bam
    所有做相同处理
    
    1. Functional Annotation of Assembled Transcripts Using Trinotate

    相关文章

      网友评论

        本文标题:RNAseq教程(4.1)

        本文链接:https://www.haomeiwen.com/subject/qnljaktx.html