美文网首页
pysam使用及出现的问题

pysam使用及出现的问题

作者: byejya | 来源:发表于2020-08-18 18:35 被阅读0次

    从问题开始

    1.问题

    实际是无头文件的过 官方文档

                    应放位置:

    AlignmentFile跟的参数

    报错改变:

    非执行错误:不能迭代没头文件的sam

    问题还是头文件。尝试:

    samtools view

    解决,但是是将sam转为bam才能行的,而且用samtools view 看转出的bam并不带header,或许bam不需要header也能用来迭代,但sam不行?

    总之,bam体积小,有samtools时查看也并没有不方便,之后的程序可以改进为使用bam文件。

    问题并未解决。关于header的问题:

    如何在取出的序列的文件里加上header?

    只是暂时,只是暂时用bam规避了这个问题。现在跳过他分析结果

    rname 和rnext type查看类型,其实也没必要。

    结果是很多rname !=rnext的需要过滤。加上即可

    虽然-T但并没在bam中看到header

    查看使用结果:

    3(最新过滤的)比2(未过滤rname的)要小很多

    鉴于.sam 和._2sam没什么用了,现在已经删除。

    但是总的还不完整。缺点在1. 两条一样类型的,如下面的这个,都是HMH

    一端多匹配但是这两条全是补充序列,并非↓ 这种

    提示:还得多看取出的序列,会出现没考虑到的问题

    缺点2:现在还只是对单端多匹配在优化,并没有顾及其他类型。

    总结:1.转为bam再操作优势明显,避开考虑header的问题,其次所占存储空间小,最后并不影响操作,且取出的东西也不是二进制形式(待验证)【已验证】,原文件是bam,取出的序列却并非二进制格式。

    结果 代码

                2.two_pair.sam 漏做了,需要补上。[已补]

    相关文章

      网友评论

          本文标题:pysam使用及出现的问题

          本文链接:https://www.haomeiwen.com/subject/addhjktx.html