叶绿体基因组在组装注释时是有可能出现错误的,本文主要针对NCBI反馈意见进行修改,NCBI一般会指出哪一段基因注释存在问题。具体解决方法如下
第一步
打开注释gb文件,查看出错的序列位置和基因名,打开参考gb文件,找到出错的基因名并记下其位置。
第二步
打开参考fasta文件,将上一步记下的位置那段序列截取下来,注意join要分开,最好把启动子部分先删掉。
第三步
把截取的这段序列转成氨基酸,以确定参考序列没有出错。如果有问题,一般会出在最后几个氨基酸,带有多个终止密码子,这是我们需要删除第一个终止子后面的所有氨基酸并删除对应的碱基序列。
第四步
将修改后的参考基因碱基序列与注释序列比对,查看其对应位置,再到注释gb文件中做出相应修改。
几种密码子
起始密码子:ATG
终止密码子:TAG,TAA,TGA
关于join
可以理解为一个基因的碱基序列被分成了两部分,虽然两部分间隔有碱基,但在翻译时是可以连接起来的。
网友评论