编者按
欢迎关注微信公众号:基因学苑,更多精彩内容等你发掘!
前面写了专题《手把手教你生物信息分析平台搭建》,然后又介绍了很多《生物神奇网站》资源,也介绍了《生物信息之独孤九剑》Linux操作。那么万事俱备,就开始学习生物信息吧。所以,我们开始新的篇章——《生物信息百jia软件》。百Jia是什么意思呢?可以是百佳,也可以是百家,还可以是百加。从100家中选择100款优秀软件,掌握这些软件,就可以扩展出更多内容,这就是百Jia。
一、功能分类:
原核生物基因预测
二、软件官网:
compbio.ornl.gov/prodigal/
三、软件介绍:
prodigal的全称是Prokaryotic Dynamic Programming Genefinding Algorithm,原核的动态编程基因查找算法,prodigal主要应用于细菌和古生菌的基因预测,不能用于真核生物,如果要对meta样品做基因预测,prodigal还专门提供了meta的版本。 除此之外,prodigal还支持在线提交序列的方式来预测基因预测。也非常的易于使用。而且相对与glimmer基因预测工具,prodigal更加好用,只需一步即可,而且,软件可以直接输出基因的核酸序列并翻译出的相应的氨基酸序列,这对很多初学者来说是非常方便的。
四、下载安装:
wgethttps://codeload.github.com/hyattpd/Prodigal/tar.gz/v2.60
tar -zxvf Prodigal-2.6.1.tar.gz
make install
五、软件使用:
软件的使用比较容易,比glimmer要容易很多,只需一步即可,直接敲prodigal命令就会弹出软件帮助信息。
-a 是输出氨基酸文件-c 不允许基因一边断开,也就是要求完整的orf,有起始和终止结构
-d 输出预测基因的序列文件
-f 选择输出文件格式,有gbk,gff,和sco格式可供选择
-g 指定密码子,原核为第11套
-i 输入文件,即需要预测的基因组序列文件
-m 屏蔽基因组中的N碱基
-o 输出文件,默认为屏幕输出
-p 选择方式,是单菌还是meta样品
-q 不输错错误信息到屏幕
-t 指定训练集
-s 输出所有潜在基因以及分值到一个文件中
六、使用案例:
prodigal-aref.pep-dref.cds-fgff-g11-oref.gff-psingle-sref.stat-iref.fna>prodigal.log
七、注意事项:
1、对于原核生物基因预测,我们还需要注意一个问题,就是当样品为支原体时,在密码子选择上要修改一下,因为在支原体中遗传密码中的密码子UGA能够编译成色胺酸,而不是一般的乳白色终止码。
网友评论