美文网首页
转录组笔记(5)序列比对

转录组笔记(5)序列比对

作者: 韦巍_e3f3 | 来源:发表于2018-02-08 12:12 被阅读0次

    HISAT2:比对到基因组

    TopHat首次被发表已经是7年前,STAR的比对速度是TopHat的50倍,HISAT更是STAR的1.2倍。HISAT2是TopHat2/Bowti2的继任者,使用改进的BWT算法,实现了更快的速度和更少的资源占用,作者推荐TopHat2/Bowti2和HISAT的用户转换到HISAT2。
    官网:https://ccb.jhu.edu/software/hisat2/index.shtml(学习一个软件最好的方法就是结合现有中文资料,加上阅读官方说明书和HELP文档,一般刚开始学习的时候先使用默认参数,不要乱调参数)

    直接去hisat2的主页下载index文件即可,然后把fastq格式的reads比对上去得到sam文件。 接着用samtools把它转为bam文件,并且排序(注意N和P两种排序区别)索引好,载入IGV,再截图几个基因看看! 顺便对bam文件进行简单QC

    1. 下载index文件(小鼠)
      axel ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/mm10.tar.gz
      tar -xvzf mm10.tar.gz

      下载注释文件
      axel ftp://ftp.sanger.ac.uk/pub/gencode/Gencode_mouse/release_M10/gencode.vM10.annotation.gtf.gz

    2. 序列比对
      a. 配置 1核8G内存
      hisat2 -t -x ref/mm10/genome -1 rawdata/SRR3589960.sra_1.fastq.gz -2 rawdata/SRR3589960.sra_2.fastq.gz -S align/SRR3589960.sam


      111111111111.jpg

      运行时间38分钟,源文件1.6G

    更改配置4核32G
    for ((i=60;i<=62;i=i++));do hisat2 -t -x ref/mm10/genome -1 rawdata/SRR35899${i}.sra_1.fastq.gz -2 rawdata/SRR35899${i}.sra_2.fastq.gz -S align/SRR35899${i}.sam;done

    注释: -t 记录时间 -x hg19(index)文件路径 -1 -2 测序的两个fastq文件 -S 比对结果输出路径 -U 单端测序文件
    reference=~/wikiwei/human/ref/index/hg19/genome
    hisat2 -t -x $reference -U SRR957679.fastq -S siSUZ12_1.sam 2>siSUZ12_1.log

    参考文章

    1. 转录组入门(mac版本)
    2. https://www.cnblogs.com/freescience/p/7342895.html

    相关文章

      网友评论

          本文标题:转录组笔记(5)序列比对

          本文链接:https://www.haomeiwen.com/subject/eyffzxtx.html