https://www.biostars.org/p/302465/
https://www.biostars.org/p/297272/
啊啊啊啊啊啊
选取唯一比对的序列uniqe read
nohup ls *sam | while read id; do samtools view -S -F 4 $id | grep -v "XS:" >${id%%%_*}.sam; done &
比对到miRNA base 上的reads 数目的统计,没有好办法
我的理解是统计比对上的reads 的个数
所以,我做的是,统计sam 文件第三列,“比对的小RNA的名字”出现的个数。
ls *sam | while read id; do awk -F '\t' '{sum[$3]++}END{for(i in sum) print i "\t" sum[i]}' $id > ${id%%%.*}.counts; done &
出来的txt 文件类似于这样:
补充:我不知道为啥,我的sam 文件除了头部之外的列也以@开头,所以后面的流程就没办法进行。解决办法:
nohup ls *.sam | while read id; do sed -i "s/@HISEQ/HISEQ/g" $id; done &
得到的counts 文件合并
paste *mature.bna*counts > mature.bna.merge.counts
网友评论