理解OPLS-DA分析的原理和结果图

作者: 不愧是你_a | 来源:发表于2022-01-11 20:33 被阅读0次

理解OPLS-DA分析的原理和结果图
tapable 原理解析 1
Rxjava 线程切换原理分析
数据库设计
冒泡排序
Spring AOP 源码分析
2018-10-24 场景分析实践
学习资料汇总
ArcGIS入门教程（11）——多条件购房分析
同步异步类面试题

OPLS-DA：正交篇最小二乘法判别分析

原理：

OPLS-DA不同于PCA，它是一种有监督的判别分析统计方法。运用偏最小二乘回归建立代谢物表达量与样本类别之间的关系模型，来实现对样本类别的预测

OPLS-DA需要样本变量矩阵和样本分类矩阵两个文件确立样本关系，如下所示：

图1

结果图1：OPLS-DA得分图：

横坐标表示OSC过程中的主要成分的得分值( Tp ) , 所以从横坐标的方向可以看到组间的差异；

纵坐标表示OSC过程中的正交成分的得分值(TO) ，所以从纵坐标上看出组内的差异(组内样本间的差异)。

图2

结果图2：OPLS-DA的S-plot图

S-plot 图的横坐标表示主成份与代谢物的协相关系数,纵坐标表示主成份与代谢物的相关系数。

S-plot 图一般用来挑选与OSC过程中主要成分的相关性比较强的代谢物，从另一方面同时也可以挑选与Y相关性强的代谢物。越靠近两个角的代谢物重要度越强。红色的点表明这些代谢物的VIP值大于等于1 , 绿色的点表示这些代谢物的VIP值小于等于1。

图3

结果图3：OPLS-DA的模型验证 permutation Test图

模型验证 permutation Test 图的横坐标表示模型的准确率，纵坐标表示200次 permutation Test 中200个模型的准确率的频数，箭头表示本OPLS-DA模型准确率所在的位置。

其中R2X和R2Y分别表示所建模型对X和Y矩阵的解释率， Q2表示模型的预测能力，理论上R2、Q2数值越接近1说明模型越好，越低说明模型的拟合准确性越差。

通常情况下 , R2、Q2高于0.5较好，高于0.4即可接受。

从图中可以看出Q2为0.994 , R2Y为1 , R2X为0.685 , Q2和R2Y的P值均为0.005 ,说明 permutation Test 中只有1个随机分组模型结果优于本OPLS-DA模型，一般情况下P<0.05时模型最佳。

图4