美文网首页
写软件的总需要“自证清白” ?| 又一个 gffread 的小问

写软件的总需要“自证清白” ?| 又一个 gffread 的小问

作者: 生信石头 | 来源:发表于2023-12-11 14:21 被阅读0次

估计这个坑没有太多人能踩到。
前两日,有 GSAman 用户校正完基因结构注释后,导出 gff3 文件,用于 htseq-count 会失败。大体报错如下:


很明显,确实是报错。其中输入的是 .gtf 文件。需要明确的是无论是 GSAman 还是 TBtools,只会输出 GFF3 格式,从信息量来说,GSAman 输出的和 TBtools 输出的是等价的。
按照“常见的软件遇到问题首先找到不可信的软件作者原则”,绝大多数人会认为 gffread 没有问题,所以有问题就一定会优先认为是 GSAman 的问题。这个也正常,你不习惯也得习惯。情况就是这么个情况。
但是在我看来 GSAman 输出是肯定没问题的,信息也是全面的。如果不全面,那就用 TBtools 的 GXF Fix 处理一下。但是对方处理了,还是不行。
?到底问题出现在哪里。无奈之下,也只能要来文件,看看是否可以重现云云。
于是得到结果如下:

显而易见,从软件实现或者设计的角度来说 gffreads 是有问题的,同样的信息输入,如果行顺序有变化,那么就不能良好兼容。这块在 TBtools 里面是不存在的。因为对于 TBtools 来说,输入文件顺序是乱的,这个可太正好了,用户本来就可能手动去修改一些行列顺序,补充或者删除。但是 gffread 可没管这么多。
前述为了让排序更好看,TBtools GXF Fix 输出的行信息,或先输出 exon / CDS ,然后还是 mRNA / gene。我自认为这个很OK,比如 IGV 或者 stringtie 这些软件都没事。就 htseq-count 有事?
但事实就是这样。
索性,还是花了一点时间,对 TBtools GXF Fix 功能输出文件的排序逻辑重新构筑,确保输出行顺序可以更好符合比如 gffread 这些软件的需要,同时也是符合 htseq-count 这些软件的需要。

写在最好

很多时候,感觉写个软件,似乎总是需要“自证清白”?没什么意思,在 GSAman 上是这样,在 TBtools 上更是如此,正如以前。只是我现在想想觉得就这样吧,that's it。
为什么生信分析阻碍重重?因为很少人去care鲁棒性,“能干就行”便是原罪。
加油!想写就写,不想就别写。

相关文章

  • 自证清白

    九十二的老人倒在路边,动弹不得。来往的行人视而不见,或者不敢正视。 直到来了一辆小车,车上下来人,扶起老人并送到医...

  • 无题

    而是需要自证清白。自证的程序就是在通过他人的担保进行宣誓。因此他需要担保人,担保人必须发誓确保被告不会撒谎。如果被...

  • 自证清白的女儿

    女儿五岁了,到了第二个小叛逆期,学会了辩解,推理,甚至还会讲道理。 一次,家里的墙纸上又多了一个红色的手掌印,也没...

  • 2019-03-03

    按照他人的逻辑自证清白,就已经输了。

  • 你自证清白

    你愤怒的说,大家都是兄弟,现在却互相猜忌,就算没有恶灵,我们的关系也闹僵了。 聪明的你,意识到他们怀疑的对象就是你...

  • 何以自证清白?

    这段时间由于开滴滴,写作中断了两个星期。这两个星期,时间虽短,但也接待了不少乘客,经历了不少事件。有大老板,有上班...

  • 趣侃红楼481:条理清晰,王熙凤自证清白,剖析利弊,绣春囊危中藏

    副标题:聪明人做事高明,王熙凤自证清白痛陈利弊,让王夫人彻底无话可说 趣侃红楼481:条理清晰,王熙凤自证清白,剖...

  • 让胖子自证清白

    【返回上次选择关卡】 “既然大家都互相猜忌。不如这样吧,胡胖子你来证明自己不是恶灵吧。”已经知道恶灵是谁的你,连忙...

  • gffread软件使用教程

    gffread 不仅可以实现GTF与GFF的互相转换,而且还可以对GFF文件进行过滤处理。可以直接读取GTF文件。...

  • 潮涌

    如此一般自我拉扯,总好过被瘾所困 床上床下自证清白,大不必虚度此生 缺少拥抱失魂落魄,深过夕阳的海岸 疑问困住的话...

网友评论

      本文标题:写软件的总需要“自证清白” ?| 又一个 gffread 的小问

      本文链接:https://www.haomeiwen.com/subject/fjdmgdtx.html