(1) 数据对象:
叶绿体 or 细胞核
(2) 分子标记类型:
常用DNA条形码(nucleus ITS, chloroplast rbcL/matK/trnL-F/…),基因,编码区,外显子(编码序列),内含子,编码区、外显子或内含子中特定位置的密码子,外显子(编码序列)对应的氨基酸序列。
(3) 分子标记数量:
常用有限DNA条形码,自开发有限分子标记,基于SNP筛选的所有潜在分子标记、以标记类型为单位的所有序列。
根据课题目标确定好以上选项,然后分析。
(4) 序列比对:MAFFT
Manual: https://mafft.cbrc.jp/alignment/software/manual/manual.html#lbAI
中文教程:https://mp.weixin.qq.com/s/-dVHcF2JIM7qOXCfrin8yg
(5) 序列修剪:Trimal
Simple tutorial: http://trimal.cgenomics.org/use_of_the_command_line_trimal_v1.2 (另官网还有Manual可下载:OVERVIEW- Publications- Manuals,但似乎与网页Simple tutorial有些不同,例如输出命令无-out等)
中文教程(基本对应simple tutorial):https://www.jianshu.com/p/4470dd2abbbb
(6) 人工检查修剪:Mega(暂定)
之所以要人工检查修剪,是因为对于引物扩增分子片段,两端不齐不是进化gap所致,软件无法识别,因此需手动删除。即便是重测序数据,也会出现未覆盖的区域(浅层测序益甚),这些区域需人工判断是否删除。有时候我们无法判断序列中gap是测序误差还是进化的结果,为排除这种不确定性,可将含有gap的位点全部删除(需根据Trimal结果慎重决定)。
(7) 多基因联合:PhyloSuite
PhyloSuite-Alignment-Concatenate Sequence
(8) 模型预测:PartitionFinder2
Manual: http://www.robertlanfear.com/partitionfinder/assets/Manual_v2.1.x.pdf
中文教程:
http://htmlpreview.github.io/?https://github.com/brettc/partitionfinder/blob/master/docs/PartitionFinder2%E7%9A%84%E4%B8%80%E8%88%AC%E4%BD%BF%E7%94%A8%E6%96%B9%E6%B3%95%EF%BC%88%E4%B8%AD%E6%96%87%E7%89%88-%E7%BD%91%E9%A1%B5%E7%89%88%EF%BC%89.html
存疑:后续用不同方法建树的模型选用相同或否?
(9) 构建基因树、蛋白树
① 极大似然法:iqtree
Manual: http://www.iqtree.org/doc/Command-Reference#general-options
② 贝叶斯推断:MrBayes
Manual: https://gensoft.pasteur.fr/docs/mrbayes/3.2.7/Manual_MrBayes_v3.2.pdf
网友评论