bam文件分段计数

作者: 线断木偶人 | 来源:发表于2020-03-06 11:56 被阅读0次

bam文件分段计数
day48 转录组计数&表达矩阵
IGV的使用
bam/sam数据格式——转载
生信实用工具：快速的多线程分割bam文件工具
samtools软件的使用
文章复现-全外显子数据分析学习7-bam文件载入igv可视化
SAMtools——bam文件排序
WES2Neoantigen Pipeline
常见格式——bam

目的：分别计算某一人区间的reads。
方法实现：R、perl、Python等等

方法一

#samtools view NT001.bam | awk '{print $3,$4}' > file1.txt

dat <- read.table("file1.txt",header=FALSE,colClasses= c("character","integer"))
colnames(dat)=c("refChr","begin")

chrs <- paste("chr", c(paste(1:22, sep = ""), c("X","Y")), sep = "")
dat <- dat[dat$refChr %in% chrs,]
binindex = ifelse((dat$begin%%50000)==0,floor(dat$begin/50000)-1,floor(dat$begin/50000))
fastbincount = table(paste(dat$refChr,binindex, sep="_"))
file <- data.frame(fastbincount )
colnames(file)=c("binName","counts")
chr_all <- read.table("all_chr.txt")
colnames(chr_all) = "binName"
chr_all$binorder=c(1:61927)

bininfo = merge(chr_all,file, by="binName",all.x=T)
bininfo=bininfo[order(bininfo$binorder),]
bininfo[is.na(bininfo)] <- 0
write.table(bininfo,"bininfo.txt",quote=F,row.names=F,col.names=F)

方法二：pysam

import numpy as np
import pysam
def convert_bam(infile):
    bam_file = pysam.AlignmentFile(infile, 'rb')
    
    for index, chr in enumerate(bam_file.references):
        #print(index,chr
        if index > 23 :
            continue
        
        #print(chr,bam_file.lengths[index])

        counts = np.zeros(int(bam_file.lengths[index] / float(50000) + 1), dtype=np.int32)
        bam_chr = bam_file.fetch(chr)
        #print(bam_chr)

        for read in bam_chr:
            #print(read)
            
            location = read.pos / 50000
            counts[int(location)] += 1

        for i in counts:
            print(i)

if __name__=="__main__":
    convert_bam("NT001.bam")

方法三：

bedtools coverage -a segment.bed -b nend.bam > segment_reads.txt

结论：方法一 == 等于方法二 >方法三，就是说方法三没有一、二精确。

网友评论

本文标题：bam文件分段计数

本文链接：https://www.haomeiwen.com/subject/pecbrhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

bam文件分段计数

相关文章

bam文件分段计数

day48 转录组计数&表达矩阵

IGV的使用

bam/sam数据格式——转载

生信实用工具：快速的多线程分割bam文件工具

samtools软件的使用

文章复现-全外显子数据分析学习7-bam文件载入igv可视化

SAMtools——bam文件排序

WES2Neoantigen Pipeline

常见格式——bam

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读