前言
本资料整理了高光谱遥感图像概念定义、分析处理与分类识别的基本知识。第一部分介绍高光谱图像的一般性原理和知识,第二部分介绍了高光谱图像的噪声问题;第三部分介绍高光谱图像数据冗余问题以及数据降维解决冗余的方法;第四部分介绍高光谱图像的混合像元问题,对光谱解混做了一定介绍;第五部分和第六部分分别介绍了高光谱图像的监督分类和分监督分类的特点、流程和常用算法。
1.基本介绍
高光谱遥感(Hyperspectral remote sensing) 是将成像技术和光谱技术相结合的多维信息获取技术,同时探测目标的二维集合空间与一维光谱信息,获取高光谱分辨率的连续、窄波段图像数据。
性能分析表可以由表总结为:
- CPCA 的优势在于信息损失小,变换后数据结构变化小,但是该方法受数值和噪声影响大;
- SPCA的优势在于受数值影响小,且在信息保留和数据结构保留保持两方面也不错,但该方法受噪声影响大;
- MNF 受数值和噪声影响小,同时信息损失小,但变换后数据结构影响很大;
- MAF 性能最差,不适用于目标探测中的高光谱数据降维
4.高光谱图像混合像元
遥感器所获取的地面反射或发射光谱信号是以 像元(pixel) 为单位记录的。由于高光谱成像光谱仪在获取大量波段时,会导致其每个波段的辐射信号较弱,为了提高信噪比、保证图像质量,就需要保证一定角度的瞬时视场角(IFOV),因此,相比全色和多光谱图像,高光谱图像的空间分辨率低,使得混合像元的问题尤为突出。
所以高光谱图像无法利用传统的图像空间信息进行分析的方法,而是利用其上百个波段丰富的光谱信息,从光谱维来挖掘图像的信息。
4.1 非线性光谱混合模型和线性光谱混合模型
物体的混合和物理分布的空间尺度决定了非线性的程度,大尺度的光谱混合完全可以被看作是一种线性混合,二小尺度的内部无核混合是非线性的。在高光谱应用中,利用非线性模型计算出的结果比线性模型计算出的结果要好,但是其需要输入众多的参数,这个实际的应用带来了困难。
非线性模型
- Hapke 混合光谱模型
- K-M(KUBELK-MUNK) 混合光谱理论模型
- 基于辐射通道密度理论的植被、土壤光谱混合模型
- SAIL 模型
- PROSPECT 模型和PROSAIL 模型
线性模型(LSMM)
当入射光在地物之间不存在多次散射时,在一定IFOV内所形成的混合像元可以通过线性混合模型(LSMM)进行描述。
4.2 光谱解混
解决混合像元问题的过程称为混合像元分解或光谱解混,就是根据遥感图像提供的信息判断每个混合像元是由哪些纯像元以怎样的方式混合的。但是,严格意义上的纯像元实际是不存在的,所以在进行解混时,通常是用图像中包含某种比例很高特征地物的像元代替纯像元。这些代替纯像元的近似纯像元,被称为端元。
线性光谱解混是利用LSMM 将遥感图像$\bf{X}$ 中每个混合像元分解成其端元和对应丰度,从而得到端元矩阵 $\bf{E}$ 和 丰度矩阵(即所占比例) $\bf{A}$ 的过程。即
$$
\bf{X_{L \times n} = E_{L \times m} A_{m \times n} + \epsilon _{L \times n}}
$$
基本工作分两步:端元提取,即确定$\bf{E}$,丰度反演,即确定 $\bf{A}$。
- 确定端元数目,在少数波段的多光谱图像中可使用PCA 根据协方差特征值的大小确定;在高光谱中使用Neyman-Pearson 探测理论的特征阈值分析分析方法确定,(确定数目中还需要对噪声进行评估,可采用光谱维去相关(SSDC)法);
- 端元提取:MaxV 方法直接用于端元提取,N-FINDER 方法需先降维再提取端元,采用降维时,提取效果:$MaxV>MNF>MAF>CPCA>SPCA$ ;
- 端元光谱变异性:由于非线性因素的影响,端元的光谱存在变异性,即同一类型存在多种端元,这也是线性光谱解混误差的主要因素之一。混合像元以及端元的光谱变异性,都是对客观事物的不确定性描述,可用模糊子集和模糊测度的思想来解决;
常用的端元提取方法还有:
- 纯像元指数(pure pixel index, PPI) 算法;
- 改进的快速迭代PPI(faster iterative PPI, FIPPI) 算法;
- 内部最大体积(N-FINDER)算法;
- 顶点成分分析(vertex component analysis,VCA) 算法;
- 基于最大距离(maximum distance, MaxD) 算法;
- 基于最大体积(maximum volume, MaxV)算法;
- 定量化独立成分(ICA)及其衍生算法等。
当得到端元矩阵 $\bf{E}$ 后,就要通过丰度反演求解高光谱图像中每个像元里各个端元所占比例,即求 丰度矩阵$\bf{A}$ 的过程。
常用的方法有:
- 最小二乘法(LS):
- 无约束(UCLS)
- "和为1"约束(SCLS)
- “非负”约束(NCLS)
- 全约束(FCLS)
- 滤波向量(FV)法
- 迭代光谱混合分析(ISMA)法等
5.高光谱遥感数据监督分类
高光谱图像数据将地物光谱信息和图像信息融为一体,其数据具有几何空间、光谱特征空间两类表达方式。
几何空间:直观表达每个像元在图像中的空间位置以及它周边像元之间的相互关系,为高光谱图像处理提供空间信息。
光谱特征空间: 高光谱遥感图像每个像元对应着多个成像波段的反射值。近似连续的光谱曲线表示为一个$N$维向量,向量在不同波段值的变化反映了其代表的目标的辐射光谱信息,其优势是特征维度的变化和扩展性。我们处理将高光谱像元作为高维特征空间的数据点,根据数据的统计特性来建立分类模型,但是它的弱点是无法表达像元间的几何位置关系。
监督分类常用于高光谱图像数据的定量分析,其主要流程是:首先,利用分类器对已知类别机器对应的训练样本进行学习,获取各图像上各类别像元的分类特征;然后,选择适当的分类判据,根据分类的决策准则进行分类。
一般按以下步骤进行:
- 高光谱数据选择。
- 图像的预处理。即几何配准、校正等,确保获取正确光谱和几何信息。
- 确定地物种类。即根据提取的训练数据特征确定分类类别。
- 选择训练样本。
- 特征提取和特征选择。选择各类地物可区分性最强的特征从而提高分类精度。
- 选择合适的分类方法进行分类。
- 分类后处理。传统基于像元分类方法分类后可能存在大量噪声及孤立像元,根据地物的连续性,利用主成分滤波等方法减少该因素影响,从蹄提高分类精度。
- 分类结果评价。根据已知类别的测试数据类别与分类结果比较,确认分类的精度与可靠性。
5.1 基于光谱特征空间分类
基于光谱特征空间的高光谱图像分类方法主要是建立在对高光谱图像光谱特征提取和变换的基础上,分为两种思路:一种是基于地物物理光学性质的光谱曲线来进行地物识别,代表性方法是光谱特征匹配方法;另一种是基于特征空间的分类方法,主要利用数据的统计特征来建立分类模型,主要方法有传统的遥感分类方法以及神经网络,支持向量机等复杂的图像分类方法。
5.1.1 光谱特征匹配分类方法
基于光谱曲线进行分类识别是利用光谱库中已知的光谱数据,采用匹配的算法来识别图像中地面覆盖类型。这种匹配既可以是全谱段范围内比较,也可以是感兴趣波段的光谱比较。
基于光谱间最小距离的匹配算法是在计算未知光谱与参考光谱距离后,再根据最最小二乘原则进行匹配的分类方法。该方法对噪声敏感,所以匹配前需要去噪预处理。
光谱角度填图(spectral angle mapping, SAM)方法 把光谱看作是光谱空间的多维矢量,计算两光谱向量的广义夹角,夹角越小,光谱越相似,最终根据相似性阈值对未知像元光谱进行分类。SAM 方法的显著特征是夹角值与光谱向量模无关,只比较光谱在形状上的相似性,这也是SAM方法与前者的区别与优势。
高光谱图像的光谱波段间隐含这特定的物理含义,光谱曲线的形状特征是地物内在物理化学性质的外在反映。
5.1.2 遥感图像统计模型分类方法
基于统计的极大似然分类是传统遥感图像分类中应用最广泛的分类方法,在极大似然分类器中,首先为简化分类过程,假设高光谱图像每类地物的概率密度都服从多维正态分布,然后利用分类训练样本分别对统计参数进行估计获得其概率密度函数,最后利用Bayes 公式将最大似然概率公式变为
$$
p(x|w_i)p(w_i) \geq p(x|w_j)p(w_j)
$$
式中, $p(w_i)$和 $p(w_j)$ 分别是类$i$与类$j$的先验概率分布,实际中由于无法估计,假设其相等。所以在实际分类过程中,将各像元划分到其属于图像上不同类别的概率中较大的那一类中去。
不足:要想获得好的效果,统计参数的估计变得十分重要;为了获得可靠的参数,每个类别必须有足够的训练样本,这对于上百个波段的高光谱图像是很困难的。
5.1.3 高光谱图像神经网络的方法
后面结合深度学习最新知识再详细介绍。
不足:高光谱图像分类时,经常遇到“同物异谱”想象,这使得神经网络的分类算法难于收敛,严重降低分类精度。
5.1.4 高光谱图像支持向量机的方法
支持向量机方法用于高光谱图像分类的优点是能够直接对高维数据处理,不必经过降维处理,而采用全部波段进行分类,保证了光谱信息的充分性。
原始SVM 算法是二分类器,在高光谱图像的多分类以及精细分类中,采用多个SVM 组合或级联的方式实现多分类。
5.2 几何空间与光谱特征空间结合的高光谱图像分类
基于光谱特征空间的高光谱图像分类方法是将高光谱数据作为一种无序的待聚类数据集合,没考虑像元点的几何空间特征,综合高光谱图像的几何空间特征和光谱特征空间进行分类,能够有效提高分类精度。
5.2.1 基于同质地物提取的高光谱图像分类方法(ECHO)
前提:图像空间分辨率较高(优于5m),常用实验数据集如AVIRIS Data 大约20m左右
主要思想:首先将图像划分为不同的图像对象,图像对象为形状与光谱特征具有相似性的同质区域;对于没有划入同质区域的像元利用极大似然分类器对它们进行分类最终获取分类结果。
5.2.2 纹理信息辅助下的高光谱图像分类
利用灰度共生矩阵进行纹理统计。
5.3 面向对象的高光谱遥感图像分类
面向对象分类的特点即分类的最基本对象从像元转换到图像对象。分类的核心是高光谱图像的分割,在这个阶段应该结合光谱信息和空间信息。
面向对象的高光谱图像分类框架上图是面向对象的高光谱图像分类框架。
5.4 高光谱图像的分类精度评价
5.4.1 误差矩阵
误差矩阵的主体是一个 $k \times k$ 的方阵,其中列为地面参考验证信息,行为分类结果,矩阵的对角元表示被分到正确类别的像元个数,对角线以外的元素表示错分的误差。
其中,生产者精度(PA)
$$
PA_i = \frac{x_{i,i}}{x_{+i}}
$$
用户精度(UA)
$$
UA_i = \frac{x_{i,i}}{x_{i+}}
$$
5.4.2 漏分误差和多分误差
漏分误差(OE)是指类别$i$在误差矩阵中,有多少被错误分到了其他类别,类别$i$的漏分误差
$$
OE_i =1- \frac{x_{i,i}}{x_{+i}}
$$
多分误差(CE)是将其他类别像元错误划分到$i$类中,某类别$i$的多分误差为
$$
CE_i =1- \frac{x_{i,i}}{x_{i+}}
$$
5.4.3 Kappa 分析
Kappa 分析是一种定量评价遥感分类图与参考数据之间一致性或精度的方法,能识别整体图像的分类误差性。
$$
Kappa = \frac{总体精度-期望精度}{1-期望精度}
$$
计算得到
$$
Kappa = \frac {N \sum_{i=1}^kx_{i,i} - \sum_{i=1}^k(x_{i+} \times x_{+i})} {N^2 - \sum_{i=1}^k(x_{i+} \times x_{+i}) }
$$
6.高光谱图像非监督分类
高光谱图像的非监督分类算法还是采用传统遥感中的非监督方法,如 K-means 算法、ISODATA 算法、FCM 算法等算法以及它们的优化算法。
高光谱图像的非监督分类使用过程中需要注意这几个问题:
- 高光谱图像的波段众多,在自学习中会产生大量冗余,分类前进行特征提取和选择有利于提高自学习过程效率;
- 可以充分利用高光谱图像中端元提取、光谱分析等手段获得较精确的类别初值,辅助非监督分类;
- 选择非相似性度量时,需要充分考虑地物光谱特征,适当选择;
- 利用搜索算法求解非监督分类目标函数时,尝试利用全局搜索算法代替局部搜索算法提高非监督分类精度。
网友评论