写在前面的内心OS:感受一下ddl之前交作业的快感,主要还是因为后面有一大堆事情要做。
马上九月了,2020年的进度条已经跑了3/4了。想想过去的四分之三的慵懒,剩下的1/4是时间,大概会是在执行过去时间所制定的各种plan或planB中度过吧。那被推迟了N次,让我完成无数次心理建设的开学终于要来了。内心竟然有那么一丝丝恐慌,所幸在那N次心里建设中,学会了接受最坏的情况。无所谓了,冲吧。
开学一定会很忙的吧,半月一顿可能无法保证了。但今年搞定的Flag不能也不会倒的!
非约束排序的目的在于寻找数据的连续性(通过连续的排序轴展示数据的主要趋势)。非约束排序实际上是将多维空间内的数据点尽可能排列在可视化的低维空间,是描述性的方法,所以不存在统计验证评估排序结果显著性的问题。而降维空间内的排序的基本原理可简单概括为将最长的一轴作为第一轴,后面的每一轴都与前一轴正交。
本章所讨论的方法有:
主成分分析(PCA):基于特征向量的主要排序方法。分析对象是原始的定量数据,标尺为1时展示的是样方之间的欧氏距离,标尺为2时展示的是样方之间的Mahal-anobis距离。
对应分析(CA):分析对象必须是频度或类频度、同量纲的非负数据。展示的是卡方距离。
多重对应分析(MCA):分类变量数据表的排序。(所有变量都是因子的数据框)
主坐标分析(PCoA):分析对象为距离矩阵,非原始的样方-变量矩阵表格。可以灵活选择关联测度。
非度量多维尺度分析(NMDS):尝试在预先设定数量的排序轴去排序对象,不是基于特征向量提取。目标是保持对象排位关系的不变。
PCA
致力于分析定量数据,展示欧氏距离和线性关系。物种数据进行PCA之前需要进行适当的转化。
PCA结果中,惯量(inertia)基于协方差矩阵的PCA分析时为变量总方差;基于相关矩阵的PCA时为相关矩阵的对角线数值和,即变量自相关系数的总和,也等于变量的数量。
特征根(eigenvalues)是每个排序轴的重要性(方差)的指标。
标尺(Scaling):1,距离双序图。特征向量被标准化为单位长度,关注的是对象之间的关系。双序图中对象之间的距离近似于多维空间内的欧氏距离。2,相关双序图。每个特征向量被标准化为特征根的平方根,关注的是变量之间的关系。双序图中代表变量箭头之间的夹角反映变量之间的相关性。
Species scores:代表变量的箭头在排序图的坐标。所有的响应变量都统称为物种
Site scores:对象在排序图的坐标。所有的对象都统称为样方。

标尺=1的双序图还需注意的是平衡贡献圆,它的半径为 。d是双序图的轴数量,p是PCA的维度(即变量的个数)。平衡贡献圆的半径代表变量的向量长度对排序的平均贡献率。若某个变量的箭头长度长于圆的半径,代表它对这个排序空间的贡献大于所有变量的平均贡献。




(环境因子被动加入物种数据PCA分析,可以总览物种数据的结构,也可以推测这种结构与环境因子的关系。)

对应分析(CA)
CA产生的排序轴总是比样方数或物种数中较少者少1。每个特征根除以总惯量表示每轴贡献率。
标尺=1时,行(样方)是列(物种)的形心,关注的是对象(样方)之间的关系。在排序图上,样方点越近代表这些样方内的物种相对多度越相似。一个样方的点靠近一个物种的店,表示该物种对于该样方的贡献比较大。
标尺=2时,列(物种)是行(样方)的形心,关注的是物种之间的关系。物种点之间距离越近代表它们的相对多度沿着样方分布越相似。一个物种点靠近一个样方点,表示该物种在该样方内存在的可能性很大,或是在该样方内的多度比在其他更远的样方内大。标尺的选择,之影响用于制图的特征向量,不影响特征根。





主坐标分析(PCoA)
在此过程中,用户可以自己选择某种相似或距离测度度量对象之间的相互关系。如果需要将变量(物种)被动投影到对象(样方)PCoA排序图内,可以通过排序轴的相关分析或加权平均法进行。



非度量多维尺度分析(NMDS):
可以基于任何类型距离矩阵对对象(样方)进行排序。根据排位顺序进行计算。


代码数据函数见链接:https://pan.baidu.com/s/1_xMfnrnaTiVWbol97Gc2CA
提取码:zet7
网友评论