从问题开始
1.问题
实际是无头文件的过 官方文档应放位置:
AlignmentFile跟的参数报错改变:
非执行错误:不能迭代没头文件的sam问题还是头文件。尝试:
samtools view解决,但是是将sam转为bam才能行的,而且用samtools view 看转出的bam并不带header,或许bam不需要header也能用来迭代,但sam不行?
总之,bam体积小,有samtools时查看也并没有不方便,之后的程序可以改进为使用bam文件。
问题并未解决。关于header的问题:
如何在取出的序列的文件里加上header?
只是暂时,只是暂时用bam规避了这个问题。现在跳过他分析结果
rname 和rnext type查看类型,其实也没必要。结果是很多rname !=rnext的需要过滤。加上即可
虽然-T但并没在bam中看到header查看使用结果:
3(最新过滤的)比2(未过滤rname的)要小很多鉴于.sam 和._2sam没什么用了,现在已经删除。
但是总的还不完整。缺点在1. 两条一样类型的,如下面的这个,都是HMH
一端多匹配但是这两条全是补充序列,并非↓ 这种提示:还得多看取出的序列,会出现没考虑到的问题
缺点2:现在还只是对单端多匹配在优化,并没有顾及其他类型。
总结:1.转为bam再操作优势明显,避开考虑header的问题,其次所占存储空间小,最后并不影响操作,且取出的东西也不是二进制形式(待验证)【已验证】,原文件是bam,取出的序列却并非二进制格式。
结果 代码2.two_pair.sam 漏做了,需要补上。[已补]
网友评论