美文网首页
被子植物·叶绿体组装、注释与比较分析·实用命令

被子植物·叶绿体组装、注释与比较分析·实用命令

作者: Yizhe_Lin | 来源:发表于2023-10-22 01:15 被阅读0次
(1) 组装:GetOrganelle
例:get_organelle_from_reads.py -1 forward.fq -2 reverse.fq -o plastome_output -R 15 -t 16 -k 21,45,65,85,105 -F embplant_pt # Manual建议的均衡参数设置。-R:提取叶绿体基因 reads 的轮次(轮次越多,耗时越长);-t:线程 -k:K-mer;-F:组装叶绿体
附:get_organelle_from_reads.py -1 forward.fq -2 reverse.fq -o nr_output -R 10 -t 16 -k 35,85,115 -F embplant_nr # Manual建议的nrITS组装参数
(2) 软件注释:PGA
例:PGA.pl -r reference -t target  
  # -r参考基因组,开发者推荐无油樟Amborella trichopoda,参考可放多个,引多个目录即可(-r, -t 地址均引用到文件夹,而不是文件本身);-t拟注释的组装文件

  GetOrganelle获得的是.fasta文件,可用Geneious实现格式转换。
  我以Castanopsis一种为测试对象,使用Amborella trichopoda与NCBI Reseq C. hystrix分别为参考注释目标物种。结果以无油樟为参考注释得更多基因。无油樟是被子植物最基部类群(APGⅣ),属于最早完成注释的被子植物叶绿体基因组之一,可能较后来不知以何方法、参考注释的部分叶绿体更具参考价值。基于这一尝试,作者建议我先用Amborella trichopoda注释得我所需要的一个物种的叶绿体,然后使用Amborella trichopoda与该首次被注释的物种这两个基因组做参考注释更多近缘物种。
  几个使用过程中出现的问题:
  (1) 参考基因组可放多个,一起放在-r指定的文件夹中即可;待注释的组装文件也可在-t文件夹下放多个,软件将自动注释所有文件。
  (2) 放置多个参考所得注释结果的 warn 数目可能不等同于单个参考分别注释的 warn 之和,因为不同参考间不一致的部分软件会提醒我们重新审核。
  (3) 遇到如下错误:Command line argument error: Argument "query". File is not accessible: '/home/projectpath/plastome/test/test_ref//%W6RcFEu-IZgZ%_reference1'。我通过修改环境变量$PATH的位置得以解决,即:

export PATH=$PATH:/home/csp/lyz/software/PGA #错误写法
export PATH=/home/csp/lyz/software/PGA:$PATH #正确写法

  sp. Amborella trichopoda参考基因组位置:xxx/PGA/test/angiosperms/reference

(3) 完善注释:Geneious
(4) ……(待续)

参考文献:

[1] GetOrganelle-Toturial: https://github.com/Kinggerm/GetOrganelle
[2] PGA-Toturial: https://github.com/quxiaojian/PGA
[3] 叶绿体基因组注释软件PGA使用说明(开发者):https://www.jianshu.com/p/6ac8a9fad9c9?native.theme=1

相关文章

网友评论

      本文标题:被子植物·叶绿体组装、注释与比较分析·实用命令

      本文链接:https://www.haomeiwen.com/subject/nheridtx.html