美文网首页
RNAseq教程(1.4)

RNAseq教程(1.4)

作者: 周小钊 | 来源:发表于2020-12-22 20:30 被阅读0次

    目录

    1.Module 1 - Introduction to RNA sequencing

    1. Installation
    2. Reference Genomes
    3. Annotations
    4. Indexing
    5. RNA-seq Data
    6. Pre-Alignment QC

    2.Module 2 - RNA-seq Alignment and Visualization

    1. Adapter Trim
    2. Alignment
    3. IGV
    4. Alignment Visualization
    5. Alignment QC

    3.Module 3 - Expression and Differential Expression

    1. Expression
    2. Differential Expression
    3. DE Visualization
    4. Kallisto for Reference-Free Abundance Estimation

    4.Module 4 - Isoform Discovery and Alternative Expression

    1. Reference Guided Transcript Assembly
    2. de novo Transcript Assembly
    3. Transcript Assembly Merge
    4. Differential Splicing
    5. Splicing Visualization

    5.Module 5 - De novo transcript reconstruction

    1. De novo RNA-Seq Assembly and Analysis Using Trinity

    6.Module 6 - Functional Annotation of Transcripts

    1. Functional Annotation of Assembled Transcripts Using Trinotate

    1.4 Indexing

    创建HISAT索引

    为chr22和ERCC spikein序列创建HISAT2索引。HISAT2可以将外显子和剪接位点合并到索引文件中进行对齐。首先创建一个剪接站点文件,然后创建一个外显子文件。最后制作FM索引。

    要了解更多关于HISAT2索引策略与其他软件的不同之处,请参阅说明书

    hisat2_extract_splice_sites.py chr22_with_ERCC92.gtf >INDEX/splicesites.tsv
    hisat2_extract_exons.py chr22_with_ERCC92.gtf >INDEX/exons.tsv
    hisat2-build -p 8 --ss INDEX/splicesites.tsv --exon INDEX/exons.tsv chr22_with_ERCC92.fa INDEX/index
    

    [可选]为所有染色体创建索引,而不是仅仅为chr22,你会做以下操作:

    注意:下面的例子没有利用将剪接位点和外显子添加到索引。如果需要,可以使用完整的GTF生成这些文件,并使用适当的选项将它们添加到命令中。

    警告:为了索引整个人类基因组,HISAT2需要160GB内存。AWS实例大小将耗尽RAM。

    #cd /home/ubuntu/workspace/data/fasta/GRCh38
    #hisat2-build -p 8 Homo_sapiens.GRCh38.dna_sm.primary_assembly.fa Homo_sapiens.GRCh38.dna_sm.primary_assembly
    

    相关文章

      网友评论

          本文标题:RNAseq教程(1.4)

          本文链接:https://www.haomeiwen.com/subject/hsqenktx.html