美文网首页
BAM 处理

BAM 处理

作者: 孟令君 | 来源:发表于2023-11-26 10:17 被阅读0次

    bam格式文件处理大全

    image.png
    • 1 生成sam文件
      bwa,bowie2,tophat2等。输入数据为fasta格式,作为比对参考序列;fastq格式的测序数据,也就是将测序数据比对回参考序列上。

    samtools

    • 2 文件验证

    samtools quickcheck

    • 3 sam和bam格式转换

    samtools view

    • 4 bam排序

    默认的输出文件中,是按照比对的reads顺序进行排序的,而分析需要按照染色体坐标位置排序,所以,每一次都需要对bam进行排序,如果不排序,后续的操作都无法进行,还是同样的原理,边比对边排序消耗资源太大,所以,是在比对后进行排序。现在的samtools工具可以排序与转换同步进行。一般排序后的文件都加上扩展名sorted,表示经过排序了。

    samtools sort

    • 5 建立索引
      处理大文件都需要一个索引,索引的作用是可以快速定位到文件的任意位置,因此,建立索引,也是bam文件的重要功能,而建立索引,必须是排序后的bam文件。所以,拿到一个比对好的sam之后,基本处理就是排序,格式转换,建立索引。
      samtools index

    • 6 统计

    samtools stats

    • 7 reads比对情况

    samtools flags
    samtools flagstat

    • 8 idxstats
      单独计算每一条染色体的比对情况,

    • 9 统计目标区域
      则可以给定一个目标区域bed格式文件,使用bedcov进行统计。

    • 10 depth统计
      计算测序深度depth,samtools depth

    • 11 统计bam并绘图
      samtools stats
      plot-bamstats

    • 12 过滤数据

    将没有或成功比对上的reads输出
    samtools view功。-f与-F选项

    • 13 输出比对fq或fa
      samtools fastq可以直接输出fastq格式,、数据可以直接进行拼接,samtools fasta直接输出fasta,可以直接进行blastn比对。

    • 14 tview
      查看每个位点的细节

    • 15 tablet 可视化
      tablet可以可视化bam文件

    • 16 MarkDuplication
      Dupliacation reads会对变异检测造成干扰,得到一些假阳性的结果,因此,需要将这些reads去除掉。可以在比对之后进行标记。这一步骤只是在每一行比对结尾出添加一些CIGAR标志,并不过滤数据。samtools可以标记Duplication,也可以去除掉reads,GATK也可以进行标记。

    • 17 利用bcftools/freebayes/GATK进行SNP检测
      可以使用bcftools直接来筛选SNP,输入排序并建立索引的bam即可,如果能做Mark Duplication则更好了。

    • 18 利用delly/lumpy/进行SV检测

    • 19 利用IGV可视化数据
      IGV工具可以可视化bam格式,fasta格式,vcf格式,bed格式

    相关文章

      网友评论

          本文标题:BAM 处理

          本文链接:https://www.haomeiwen.com/subject/mbrvwdtx.html