概述

非度量多维尺度分析（NMDS 分析）是一种将多维空间的研究对象（样本或变量）简化到低维空间进行定位、分析和归类，同时又保留对象间原始关系的数据分析方法，能够反映对象间的顺序关系。与PCoA类似，NMDS可以基于任何类型距离矩阵对对象（样方）进行排序；但也有不同之处，NMDS不在基于距离矩阵数值，而是根据排位顺序进行计算。对于存在距离缺失的数据而言有优势，只要想办法确定对象间的位置关系，即可进行NMDS分析。由于NMDS不是特征根排序技术，也不再让排序轴载更多的变差目的；因此NMDS排序图可以任意旋转、中心化和倒置（赖江山, 数量生态学）。

NMDS计算过程：

预先设定排序轴的数量m；
在m维空间内构建对象的初始结构，初始结构是调整对象之间位置关系的起点；
在m维空间内，用一个迭代程序不断调整对象位置，目标是不断最小化应力函数（Stress function，其值被转化为0~1间的数值，可以检验 NMDS 分析结果的优劣。通常认为 stress<0.2 时可用 NMDS 的二维点图表示，其图形有一定的解释意义；当 stress<0.1 时，可认为是一个好的排序；当 stress<0.05 时，则具有很好的代表性）不断调整对象位置，直至应力函数值不再减少，或已达到预定的值；
大部分NMDS会根据PCA结果旋转最终的排序图，使结果更容易解读。

基于vegan包的metaMDS()函数的NMDS分析

setwd("D:/Rdata") #设置路径
#install.packages("vegan") #安装vegan包
#加载vegan包
library(vegan)
spe <- read.csv("nmds-spec.csv")#读取物种数据#
spe
spe.h <- decostand(spe,"hellinger")#数据标准化#
head(spe.h)

原始数据(基于多度)

标准化后的数据

#NMDS分析
spe.h.nmds <- metaMDS(spe.h,distance="bray")#NMDS分析-基于Bray-Curtis距离
spe.h.nmds
spe.h.nmds$stress#查看stress值
stressplot(spe.h.nmds, main = "Shepard 图")
map<- scores(spe.h.nmds)#提取前两轴坐标/spe.h.nmds$points#查看前两轴物种坐标
map
#导出前两轴坐标
write.csv(map,"points.csv")

迭代过程

stress值和前两轴坐标

Shepard图

Shepard 图：能够比较NMDS中对象间距离与原始距离测度矩阵中的值或者通过二者间进行线性（Linear fit）或非线性（Non-metric fit）拟合的R^2 评估，拟合R^2 越大越好/两个R^2 值越一致越好。

结果优劣评估

1、Shepard图的R^2 ：拟合R^2 越大越好/两个R^2 值越一致越好；
2、Stress值：Stress<0.2（有一定可靠性）；Stress<0.05（结果较好）；Stress<0.02（结果很好）；Stress<0.01（结果极好）。

基于ggplot2包绘制NMDS图

#ggplot2绘图
library(ggplot2)
#我们将nmds_dis_site数据导出来，然后加上分组信息再读入
map<-read.csv("points.csv",header = T)
map<-data.frame(map)
#手动添加分组信息
#也可以将excel表中的分组信息(需要导入R中)与前两轴坐标进行合并(map = merge(group, map,by="row.names",all=F))
map$name <- rownames(map)
map$group <- c(rep('A', 5), rep('B', 4), rep('C',7))
head(map)

添加分组后的作图(前六行)数据

#正式绘图
ggplot(data = map, aes(NMDS1, NMDS2))+
  geom_point(size = 2,#绘制散点图
             aes(color = group, shape = group))+
  stat_ellipse(aes(fill = group),#加上置信椭圆
               geom = 'polygon',
               level = 0.95, #置信区间95%
               alpha = 0.1, #透明度
               segments = 51, #椭圆类型
               show.legend = F)+
  theme_bw()+#主题
  geom_vline(xintercept = 0, color = 'black', size = 1, linetype = 3)+ #添加过原点线(y)
  geom_hline(yintercept = 0, color = 'black', size = 1, linetype = 3)+ #添加过原点线(x)
  xlab("NMDS1")+#x轴标题
  ylab("NMDS2")+#y轴标题
  theme(axis.title.y = element_text(size = 14))+ #y轴标题大小
  theme(axis.title.x = element_text(size = 14))+ #x轴标题大小
  geom_text(aes(x=-0.8,y=0.55,label="stress = 0.07"),size = 6)+ #设置文字位置、内容和大小
  geom_text(aes(x=-0.8,y=0.50,label="R^2 = 0.995"),size = 6)+ #添加R^2
  theme(axis.text.x=element_text(size=14,angle=0,color="Black"),#设置x和y轴字体大小和颜色
        axis.text.y=element_text(size=14,angle=0,color="Black"))+
  theme(legend.position=c(0.95,0.9))+#设置图例位置
  theme(legend.text=element_text(size=14))+ #设置图例字体大小
  theme(legend.title = element_text(face = "bold", size = 14))#设置图例标题字和大小

NMDS图

注：stress=0.12，说明结果不好，但有一定的可靠性。

图的解读

图形中的点代表样本，不同颜色/形状代表样本所属的分组信息。同组样本点距离远近说明了样本的重复性强弱，不同组样本的远近则反应了组间样本距离在秩次（数据排名）上的差异。样本相似性距离计算方式对结果有影响，选择输入不同相似性距离值的矩阵，得到的结果存在着不同程度差异。

横纵坐标轴含义：NMDS是距离值的秩次（数据排名）信息的评估，图上样本信息仅反映样本间数据秩次信息的远近，而不反映真实的数值差异，横纵坐标轴并无权重意义，横轴不一定比纵轴更加重要。

NMDS的解释量

NMDS是非参数的方法，不应该有解释量，不知道他们这些NMDS的解释率是怎么算出来的？我估计是用主坐标分析(PCoA)的解释量来作为NMDS的解释量，但这种张冠李戴的做法可能是不合适的（引自赖江山老师：http://blog.sciencenet.cn/blog-267448-1146112.html）。