这篇文献可能不是很好理解,现在还没有读完。文献已经存在noteexpress上。
在这篇文章中发现了两个比较好使的工具,记录一下。
1. [AGAT]https://github.com/NBISweden/AGAT
这个工具可以处理gff文件,只有你想得到,没有它做不到。比如,可以填补gff文件中的缺失,统计一些特征,功能统计,提取任何类型的序列,提取属性,合并注释,通过orf的大小过滤基因模型,只保留最长的可变剪接体,创造introns特征,fix cds phases, 管理IDs, UTRs introns, functional annotation,两个注释间的融合拆解,分析两个busco结果的差异,转换gff/gtf/bed 等等等等,这个工具,总的来说,就是太牛逼啦
2. [KinFin]https://kinfin.readme.io/docs/what-is-this-about https://github.com/DRL/kinfin
KinFin是一个工具包,用于通过自定义分类单元分组对聚集的蛋白质进行自动分析:
- 它采用诸如OrthoFinder或OrthoMCL等工具的蛋白质聚类输出,以及功能注释数据(InterProScan的输出)和用户定义的物种分类,以获得丰富的直系同源组聚合注释。
- 它读取标准化的文件格式,这些格式通常是基因组测序和注释项目中产生的。
- 它可以很容易的集成在比较基因组学的项目中,用于在用户定义的、分类感知的上下文中识别感兴趣的蛋白簇。
网友评论