美文网首页叶绿体分析处理
叶绿体基因组IR区边界分析的一点记录

叶绿体基因组IR区边界分析的一点记录

作者: 徒唤奈何_c5f0 | 来源:发表于2020-04-23 21:36 被阅读0次

    叶绿体边界的变化似乎反映了物种的进化历程,在叶绿体比较分析的文章中还有些意义,那个SSR分析我真的不知道有啥生物学意义,同理是mvista,就是个比对的图像。

    不过到底还是文章需要内容,也是希望在单纯的DNA序列内挖掘更多的信息,多方面的比较还是有些意义的。然而这一切都极可能毁于微小的注释错误和拼接错误。

    1 最重要的第一件事,重新检查审视叶绿体基因组序列,尤其是IR边界的基因注释。许多序列在拼接完成后依然有着许多错误,这里面有拼接方法和注释方法的问题。    

    1) 转移到核内的基因片段会被错误的拼接到叶绿体对应位置 

    2)而且基因组拼接产生的洞会干扰注释的位置和有无     

    3)Novoplasty拼接完成后,一般会分成两条contig,这两个序列IR区的左右位置不同,需要设计引物验证,或者使用脚本挑出叶绿体的reads并map到参考序列上来确认IR边界。     

    4)repeat finder 使用时,要将repeat大小的值调到尽可能小,不然IR边界部分的序列可能会因为测序错误或拼接错误无法被查找为repeat序列(即IR区),这对IR边界分析结果影响极大。在这里我推荐使用PGA-master对叶绿体注释获取IR区的注释,因为repeat finder在使用中总是不能忽略可能存在的测序错误,而产生十分大的IR/SC边界差异。在测序的部分物种中注释错误可能会达到600bp的差异,需要仔细检查。一般来说,同一科的植物,叶绿体边界差异会相当小,属内的差异几乎为0。需要手动校对两端差异。

    repeat finder因测序问题产生的分段,在其他情况下也会有两个IR区不等长的情况

    2 IR边界分析使用的软件

    IRscope,这个软件可以用于批量绘制IR边界分析图。纵观之前叶绿体基因组IR边界分析的论文,能看到 这些文章大都是分析几个编码基因在IR区域上的变化,从而反应IR区扩张收缩,以及讨论基因在IR边界程度可能代表的意义。

    运行R包,显示为对应网页版界面,可以在其中本地运行

    这个网站可以下载R包在本地运行,所以 网站崩溃 这个问题不算是问题。不过,源于注释的问题依然存在,使得IR边界分析图在部分物种中使用不便。

    这里展示了其中一种,即假基因的问题,第一条序列的假基因没有被注释,所以没有显示在软件做的图中。第二条序列我只注释了假基因ycf1删掉了真ycf1的注释。检查自己序列的注释是非常重要的,不然就会像这种,根本不可用。其他存在的问题可能就是算法的原因了,比如展示了多个rRNA的注释,没有展示对应位置编码基因的注释,这些可以先更改gb文件删掉rRNA或tRNA区来解决,最后还可以自己使用ppt或者AI手动绘图增加注释。

    3 问题补充 以后再说

    相关文章

      网友评论

        本文标题:叶绿体基因组IR区边界分析的一点记录

        本文链接:https://www.haomeiwen.com/subject/wbeovctx.html