美文网首页
2018-12-19

2018-12-19

作者: 大大大大达 | 来源:发表于2018-12-19 17:12 被阅读0次

    RNA-Seq基因组比对工具HISAT2运行问题

    (主要摘自g863402758的博客文章https://blog.csdn.net/g863402758/article/details/78132968

    HISAT2是TopHat2/Bowti2的继任者,使用改进的BWT算法,实现了更快的速度和更少的资源占用

    HISAT2安装,下载HISAT2-2.0.1,并解压:

    unzip hisat2-2.0.1-beta-Linux_x86_64.zip
    

    将HISAT2目录添加到环境变量:

    vi ~/.bashrc
    

    在文件末位添加:

    export PATH=/lustre/home/lcn/chenwen/bin/hisat2-2.0.1-beta:$PATH
    

    保存退出

    source ~/.bashrc
    

    建立索引

    建立基因组索引

    hisat2-build –p 4 genome.fa genome
    

    建立基因组+转录组+SNP索引:
    bowtie2的索引只有基因组序列信息,tophat2比对时,转录组信息通过-G参数指定。HISAT2建立索引时,就应该把转录组信息加进去。
    HISAT2提供两个Python脚本将GTF文件转换成hisat2-build能使用的文件:

    extract_exons.py Homo_sapiens.GRCh38.83.chr.gtf > genome.exon
    
    extract_splice_sites.py Homo_sapiens.GRCh38.83.chr.gtf > genome.ss
    
    
    此外,HISAT2还支持将SNP信息加入到索引中,这样比对的时候就可以考虑SNP的情况。这仍然需要将SNP文件转换成hisat2-build能使用的文件:
    extract_snps.py snp142Common.txt > genome.snp
    

    最后,将基因组、转录组、SNP建立索引:

    hisat2-build -p 4 genome.fa --snp genome.snp --ss genome.ss --exon genome.exon genome_snp_tran
    

    运行HISAT2

    hisat2 -p 16 -x ./grch38_tran/genome_tran -1 SRR534293_1.fastq -2 SRR534293_2.fastq –S SRR534293.sam
    

    相关文章

      网友评论

          本文标题:2018-12-19

          本文链接:https://www.haomeiwen.com/subject/lwgjkqtx.html