安装时间:2021.2.19
1. 简介
目前常用对基因进行注释的工具有两款:Prokka和RAST。在web of science上RAST引用次数6280次,prokka引用次数 3177次,但是prokka内置基因CDS预测工具prodigal的引用次数比RAST内置基因CDS预测工具glimmer多一千多次。同时,可能RAST的在线版本降低了其使用的难度,因此使RAST的引用次数较多。相较之下,选择使用Prokka。
Prokka是一款快速对原核生物基因组进行注释的工具,可以在10分钟内完成对一个细菌基因草图的注释工作。
2. 安装
利用conda安装
conda install prokka
3. 使用
3.1 利用内置数据库进行注释
prokka --outdir <输出内容所在文件夹> --prefix <输出文件的前缀名> <需注释文件>
- 内置数据库有三个:
ISfinder转座酶
、NCBI的耐药基因
、SwissProt数据库
。- 需要注释的文件格式为:fasta。
- 当有genbank或者蛋白序列的fasta文件时,可以加上选项
--proteins
(最好是genbank格式文件)
3.2 修改内置数据库
暂时还未用到,后面需要用到再细看
4. 生成的文件
-
.gff
:GFF3格式文件 -
.gbk
:标准的Genbank格式文件 -
.ffn
:核苷酸fasta文件 -
.faa
:氨基酸fasta文件 -
.txt
:注释结果总的说明
网友评论