常见格式——bam

作者: oddxix | 来源:发表于2018-09-20 14:51 被阅读0次

Bam (Binary Alignment/Map)

bam文件是Sam 文件的二进制压缩格式,保留了与sam 完成相同的内容信息。SAM/BAM 文件可以是未排序的,但是按照坐标(coodinate)排序可以线性的监控数据处理过程。samtools可以用来转化bam/sam文件,可以merg,sort aligment,可以去除duplicate,可以call snp及indels.

samtools view -bS ./3.mapping/aaa.sam -o ./3.mapping/aaa.bam ;
samtools sort  ./3.mapping/aaa.bam -o ./3.mapping/aaa.sort.bam;

为什么 BAM 文件 sort 之后体积会变小

BAM 文件是压缩的二进制文件,对文件内容排序之后相似的内容排在一起,使得文件压缩比提高了,因此排序之后的 BAM 文件变小了,相对应的 SAM 文件就是纯文本文件,对 SAM 文件进行排序就不会改变文件大小。而且由于 RNA-seq 中由于基因表达量的关系,RNA-seq 的数据比对结果 BAM 文件使用 samtools 进行 sort 之后文件压缩比例变化会比 DNA-seq 更甚。

相关文章

  • 常见格式——bam

    Bam (Binary Alignment/Map) bam文件是Sam 文件的二进制压缩格式,保留了与sam 完...

  • 转录组测序中的文件格式

    FastQ fastq是scRNASeq中最常见的原始数据格式。所有scRNASeq都是双端测序 BAM bam文...

  • bam格式

    本文源自 解螺旋的矿工

  • NGS常用文件格式详解

    NGS文件格式 FASTQ FASTA SAM格式 FLAG标识 BAM格式

  • 生物信息问题汇总

    比对结果bam/sam/cram如何转换? samtools bam/sam/cram格式转换[https://b...

  • 生物数据格式 - wig

    格式 当我们把测序reads比对到参考基因组后,能够得到sam/bam文件。bam/bed格式的文件主要是储存了r...

  • samtools

    序列比对:将测序reads与已知序列信息的基因或基因组进行比对,比对结果格式比较常见的是sam和bam文件。sam...

  • hisat2的使用, samtools

    一、获得fastq文件参考:bam文件转换fastqPS: 我获得的公司汇报的数据是 .bam 格式的, 所以需要...

  • WDL-第5学

    问题:用bam2fastx将bam文件转成fastq格式,这里面学到的知识: 学会写parameter_meta,...

  • 转录组入门学习(五)

    表达定量 1. 处理原始比对文件 利用 picard / samtools 将 sam 格式转换为 bam 格式 ...

网友评论

    本文标题:常见格式——bam

    本文链接:https://www.haomeiwen.com/subject/bkfnnftx.html