美文网首页
生信教程|最大似然系统发育推断

生信教程|最大似然系统发育推断

作者: 数据科学工厂 | 来源:发表于2023-09-15 22:19 被阅读0次

动动发财的小手,点个赞吧!

简介

顾名思义,最大似然系统发育推断旨在找到进化模型的参数,以最大化观察手头数据集的可能性。模型参数包括树的拓扑结构及其分支长度,还包括推理中假设的替代模型(例如HKY或GTR)的所有参数。由于当数据集包含多个类群时,这些参数的搜索空间是巨大的,因此所有用于最大似然系统发育推断的现代程序都应用启发式方法来达到最大似然参数组合。

本教程中,我将介绍最大似然系统发育推断,该程序是为此类分析开发的最快程序之一,即程序 IQ-TREE。我将演示如何通过 bootstrapping 评估系统发育中节点的可靠性,如何将未链接的替换模型应用于单独的分区,以及如何将多个基因的对齐连接起来用于相同的系统发育分析。

IQ-TREE

在本教程的这一部分中,我们将为过滤后的 16S 序列比对生成一个简单的最大似然系统发育。

  • 要了解 IQ-TREE 中可用的许多选项,请查看该程序的长帮助文本:
iqtree --help
  • 向上滚动到 IQ-TREE 帮助文本的开头。接近顶部时,您会发现 IQ-TREE 可以像这样轻松启动:
iqtree -s ALIGNMENT

# 这里,“ALIGNMENT”需要替换为比对的实际文件名。
  • 因此,让我们尝试使用对齐文件 16s_filtered.nex 运行最大似然搜索,首先针对 16S 序列数据:
iqtree -s 16s_filtered.nex

正如您将看到的,这种简约的选项选择实际上似乎已经足够了。 IQ-TREE 应在 10-30 秒内完成分析并显示输出,如下面的屏幕截图所示。

如果您阅读输出的顶部部分,您将看到 IQ-TREE 显然已自动确定您计算机上可用的 CPU 数量,并指示您可以通过指定 -nt AUTO 来使用它们。您还将看到 IQ-TREE 已正确识别序列比对的 Nexus 格式,并且它报告每个序列中缺失数据的比例。

然后,向下滚动一点到此部分:

在这里,您将看到 IQ-TREE 显然已经自动执行了最适合序列比对的替换模型的测试。这意味着 IQ-TREE 的默认设置相当于帮助文本中描述的 -m MFP 选项(扩展模型选择后进行树推理)。或者,可以指定其他替代模型,例如使用 -m GTR,但没有必要这样做; IQ-TREE为我们做模型选择非常方便。

滚动到 IQ-TREE 输出的末尾。在那里,您将找到所选替代模型的参数估计、最大似然值(在“找到的最佳分数”后以对数形式给出)、有关运行时间的信息以及输出文件的名称。写下最大似然值。

  • 根据 IQ-TREE 屏幕输出,最佳得分最大似然树被写入文件 16s_filtered.nex.treefile:

显然,所有输出文件名都是根据输入文件的名称自动选择的。

本文由mdnice多平台发布

相关文章

  • 四种建树方法比较

    标签:生信分析,系统发育,进化树 邻接法(NJ法),最大似然法(ML法),贝叶斯法(BI法)是目前主流的建树方法,...

  • RaxML使用手册

    标签:生信分析,系统发育,进化树 RaxML是最大似然法(ML法)建树的经典软件,可以建有根树,支持服务器上多...

  • RaxML使用手册

    标签:生信分析,系统发育,进化树 RaxML是最大似然法(ML法)建树的经典软件,可以建有根树,支持服务器上多线程...

  • mcmctree估算物种分歧时间

    推断物种系统发育关系以及分歧时间对探讨物种起源与演化具有重要意义。通过最大似然法(ML)构建物种进化树以及估算物种...

  • 为何需要最大后验概率推断

    1 在最大似然函数推断中,我们通过求取使得似然函数最大的参数值来估计参数。 比如在投硬币中,我们用似然函数 ( 其...

  • IQ-TREE最大似然法构建系统发育树的神器

    IQ-TREE:最大似然法构建精确、快速、灵活、广泛的系统发育树 IQ-TREE自2011年就已经开发并开源,至今...

  • 最大似然法 (3)系统发育模型的选择

    以下内容都是基于Christopher P. Randle教授在研究组上交流时的课件整理而来。 Choosing ...

  • 最大似然函数

    极大似然估计法是基于极大似然原理提出的,为了说明极大似然原理,我们先看个例子 例子:1、某同学与一位猎人一起外出打...

  • “最大似然”理解

    01 极大似然法估计思想 极大似然估计可以拆成三个词,分别是“极大”、“似然”、“估计”,分别的意思如下: 极大:...

  • 最大似然估计

    0.参数估计 参数估计分为:点估计区间估计 点估计包含:矩估计法最大似然估计法(本章讲这里)最小二乘法贝叶斯估计法...

网友评论

      本文标题:生信教程|最大似然系统发育推断

      本文链接:https://www.haomeiwen.com/subject/vsjbvdtx.html