美文网首页基因家族
实用 | 优雅地提取部分基因结构注释信息

实用 | 优雅地提取部分基因结构注释信息

作者: 生信石头 | 来源:发表于2021-01-01 17:40 被阅读0次

写在前面

很久很久以前,我就已经写过 GFF3/GTF 注释信息的部分提取功能。每一个GXF文件,往往包含的两万个左右基因(数万个转录本)的外显子,CDS等信息。而我们一般感兴趣的,常常只是其中的一些基因或转录本。
绝大多数情况,用户提取这部分基因的结构注释信息,目的在于进行基因结构可视化。但在 TBtools 里面,用户只需要直接提供:1)进化树文本;或者 2)基因 ID 列表就可以直接可视化。进行注释信息提取的步骤,看起来只是多余。于是我一直以来,并不开放这个功能。尽管在极少数的情况下,我发现,其实我也需要稍微提取以下。
既然如此,那就开放这个功能:GXF Select。

GXF Select 的使用

打开 TBtools 并跳转对应的功能。


注意版本号,这个功能才更新的

具体实例

顺便来一个有误的实例,我们看基因结构的时候,往往关注的只是一个代表性转录本的外显子和内含子结构。而非基因,因为一个基因对应多个转录本,每一个转录本各有自己的结构。
有时候,我们可能会用错 ID ,比如

写在最后

Emmm... 至此,我自认为,在 GFF3 或者 GTF 文件操作上,TBtools 的功能确实已经极其丰富,也可以满足 99% 的日常需求。今天更新的这个功能,其实常常会有人提及,但我今天才想好放出来,主要原因,或许是妥协
妥协放弃,常常我们换个角度来看,可能会让自己过得更开心一些,尽管不一定是好事,但也不一定是坏事。

相关文章

  • 实用 | 优雅地提取部分基因结构注释信息

    写在前面 很久很久以前,我就已经写过 GFF3/GTF 注释信息的部分提取功能。每一个GXF文件,往往包含的两万个...

  • Tbtools 一些功能导航

    1.优雅地提取部分基因结构注释信息[https://www.jianshu.com/p/2cbed21a62f9]...

  • linux--碱基序列处理

    从基因注释文件提取基因信息Zea_mays.B73_RefGen_v4.42.gtf gtf格式的注释文件 提取...

  • WGCNA构建共表达网络四

    一:提取指定模块的基因名 提取基因信息,进行下游分析包括GO/KEGG等功能数据库的注释。 二:模块的导出 主要模...

  • 基因组注释详解

    基因组注释(Genome annotation) 是利用生物信息学方法和工具,对基因组所有基因和其他结构高通量注释...

  • RNA-seq名词解释(7)

    (九)、分析内容相关 gene annotation:基因注释,分为基因的结构注释和基因的功能注释。 CDS pr...

  • Python3 提取CDS

    根据物种基因组和注释文件,可以编写脚本,提取特殊的序列结构,完成个性化的分析。本文利用Python3提取拟南芥的最...

  • 使用TBtools提取基因组CDS并转换成蛋白文件

    基因功能注释需要蛋白文件,有时候注释或下载的基因组没有蛋白文件,需提取并转换,据师兄师弟说gffread提取结...

  • 基因结构注释

    基因结构注释的方法包括: 从头预测根据基因结构的特征,基于算法(大多为隐马尔可夫模型)进行预测 蛋白注释根据物种自...

  • python从基因组注释文件中提取GO信息

    问题 在转录组或基因组注释文件中有基因的GO注释,为了做GO富集分析,需要从中提取每个有GO注释的基因对应的GO号...

网友评论

    本文标题:实用 | 优雅地提取部分基因结构注释信息

    本文链接:https://www.haomeiwen.com/subject/zgpjoktx.html