2020-08-26 NEwR 非约束排序

作者: SmallJam | 来源:发表于2020-08-26 19:29 被阅读0次

2020-08-26 NEwR 非约束排序
2020-07-01 大型吃书现场之NEwR（001）
PCOA NMDS
非约束排序4 对应分析（CA）
2018-11-20 mysql 表约束
5、oracle之约束
约束
初学oracle
MySQL基础--2
数据库约束

写在前面的内心OS：感受一下ddl之前交作业的快感，主要还是因为后面有一大堆事情要做。

马上九月了，2020年的进度条已经跑了3/4了。想想过去的四分之三的慵懒，剩下的1/4是时间，大概会是在执行过去时间所制定的各种plan或planB中度过吧。那被推迟了N次，让我完成无数次心理建设的开学终于要来了。内心竟然有那么一丝丝恐慌，所幸在那N次心里建设中，学会了接受最坏的情况。无所谓了，冲吧。

开学一定会很忙的吧，半月一顿可能无法保证了。但今年搞定的Flag不能也不会倒的！

非约束排序的目的在于寻找数据的连续性（通过连续的排序轴展示数据的主要趋势）。非约束排序实际上是将多维空间内的数据点尽可能排列在可视化的低维空间，是描述性的方法，所以不存在统计验证评估排序结果显著性的问题。而降维空间内的排序的基本原理可简单概括为将最长的一轴作为第一轴，后面的每一轴都与前一轴正交。

本章所讨论的方法有：

主成分分析（PCA）：基于特征向量的主要排序方法。分析对象是原始的定量数据，标尺为1时展示的是样方之间的欧氏距离，标尺为2时展示的是样方之间的Mahal-anobis距离。

对应分析（CA）：分析对象必须是频度或类频度、同量纲的非负数据。展示的是卡方距离。

多重对应分析（MCA）：分类变量数据表的排序。（所有变量都是因子的数据框）

主坐标分析（PCoA）：分析对象为距离矩阵，非原始的样方-变量矩阵表格。可以灵活选择关联测度。

非度量多维尺度分析（NMDS）：尝试在预先设定数量的排序轴去排序对象，不是基于特征向量提取。目标是保持对象排位关系的不变。

PCA

致力于分析定量数据，展示欧氏距离和线性关系。物种数据进行PCA之前需要进行适当的转化。

PCA结果中，惯量（inertia）基于协方差矩阵的PCA分析时为变量总方差；基于相关矩阵的PCA时为相关矩阵的对角线数值和，即变量自相关系数的总和，也等于变量的数量。

特征根（eigenvalues）是每个排序轴的重要性（方差）的指标。

标尺（Scaling）：1，距离双序图。特征向量被标准化为单位长度，关注的是对象之间的关系。双序图中对象之间的距离近似于多维空间内的欧氏距离。2，相关双序图。每个特征向量被标准化为特征根的平方根，关注的是变量之间的关系。双序图中代表变量箭头之间的夹角反映变量之间的相关性。

Species scores：代表变量的箭头在排序图的坐标。所有的响应变量都统称为物种

Site scores：对象在排序图的坐标。所有的对象都统称为样方。