美文网首页基因家族
实用 | 优雅地提取部分基因结构注释信息

实用 | 优雅地提取部分基因结构注释信息

作者: 生信石头 | 来源:发表于2021-01-01 17:40 被阅读0次

    写在前面

    很久很久以前,我就已经写过 GFF3/GTF 注释信息的部分提取功能。每一个GXF文件,往往包含的两万个左右基因(数万个转录本)的外显子,CDS等信息。而我们一般感兴趣的,常常只是其中的一些基因或转录本。
    绝大多数情况,用户提取这部分基因的结构注释信息,目的在于进行基因结构可视化。但在 TBtools 里面,用户只需要直接提供:1)进化树文本;或者 2)基因 ID 列表就可以直接可视化。进行注释信息提取的步骤,看起来只是多余。于是我一直以来,并不开放这个功能。尽管在极少数的情况下,我发现,其实我也需要稍微提取以下。
    既然如此,那就开放这个功能:GXF Select。

    GXF Select 的使用

    打开 TBtools 并跳转对应的功能。


    注意版本号,这个功能才更新的

    具体实例

    顺便来一个有误的实例,我们看基因结构的时候,往往关注的只是一个代表性转录本的外显子和内含子结构。而非基因,因为一个基因对应多个转录本,每一个转录本各有自己的结构。
    有时候,我们可能会用错 ID ,比如

    写在最后

    Emmm... 至此,我自认为,在 GFF3 或者 GTF 文件操作上,TBtools 的功能确实已经极其丰富,也可以满足 99% 的日常需求。今天更新的这个功能,其实常常会有人提及,但我今天才想好放出来,主要原因,或许是妥协
    妥协放弃,常常我们换个角度来看,可能会让自己过得更开心一些,尽管不一定是好事,但也不一定是坏事。

    相关文章

      网友评论

        本文标题:实用 | 优雅地提取部分基因结构注释信息

        本文链接:https://www.haomeiwen.com/subject/zgpjoktx.html