EZ | 在遥感场景分类中使用的暹罗卷积神经网络 | 02

作者: 杜若飞er | 来源:发表于2019-07-15 16:00 被阅读0次

EZ | 在遥感场景分类中使用的暹罗卷积神经网络 | 02
EZ | 在遥感场景分类中使用的暹罗卷积神经网络 | 01
EZ | 在遥感场景分类中使用的暹罗卷积神经网络 | 03
EZ | 在遥感场景分类中使用的暹罗卷积神经网络 | 04
基于CNN的遥感图像场景分类(一）
keras 例子
task8
文本分类；数据增强；模型微调 2020-02-25
TensorFlow2.0--卷积
二维卷积运算

II.方法

A.所推出方法的概览

Fig.1展示了暹罗神经网络的总体结构，使用了神经网络作为基础模型，它由几个层组成（包括卷基层、池化层还有全连接FC层），其中每一部分都在整个体系中起到了重要作用，显然，在取得图像特征这一方面，卷基层是最重要的一个。总体上来说，浅层的卷积层的到来低层次的特征，更深一些的卷积层俘获了相对高层次的特征。由前一层产生的特征图谱被送至后面的层，不同的特征图在同一个卷积层中使用不同的卷积核来提取各种视觉特征。池化层用来削减特征表示的维度并创建小旋转的不变性。最大池化是在现在广泛使用的池化方法，它计算处在一个特征图中附近位置的最大值。全连接层是整个结构中处在最后的层级，用来从前面的层之中生成一个比较好的信息的归纳。

Fig.1 网络模型结构

Fig.1 暹罗神经网络模型的结构。从两个相同类别中找到的两个图像被称之为一个 积极对 （Positive Pair），而来自于不同类的图像被称为 消极对 （Negative Pair），积极或是消极的图像对是我们模型中的输入。网络由两个鉴别CNN、三个额外的卷积层还有一个平方层（Square Layer）组成。一个通行的学习规则在特征 $f_1$ 、 $f_2$ 中使用，通过CNN模型进行学习。非参数的平方层把 $f$ 和 $f_2$ 当作输入，输出的则是 $f_s = (f_1 - f_2)^2$ ，最终得到了输入对图像的相似度( $S$ )。

B.分类Loss

我们使用了交叉熵损失作为分类Loss，来做标签检测，这个东西应该这么计算：

$\hat{p} = Softmax(θ_I o f)\tag{1}$
$Identif(f,t,θ_I) = \sum_{i=1}^K - p_ilog(p_i)\tag{2}$
$o$ 作为运算符号，表示卷积的意思，而 $f$ 是一个维度为4096的特征矢量，这些矢量是通过CNN学习到的。 $θ_I$ 表示附加卷积层的参数。基于文献^[21]中所做的工作， $t$ 表示目标类， $p$ 表示预测为该目标类的概率。因此对于目标类， $p_t = 1$ 而 $p_i = 0$ 。

C.鉴别Loss

我们仍然使用交叉熵损失作为匹配预测的鉴别Loss，这个东西应该这么算：

$\hat{q} = Softmax(θ_S o f_s)\tag {3}$
$Verif(f_1,f_2,s,θ_S) = \sum_{i=1}^2 - q_ilog(q_i)\tag{4}$ 这里 $f_1$ 和 $f_2$ 是高层特征，它们由CNN模型从一个输入端图像对中得到，它们都是4096维的特征矢量。而平方层^[21]是非参数的，用来计算出 $f_s$ ，算式如下： $f_s = (f_1 - f_2)^2$ 。然后，附加的卷积层和一个Softmax函数一起把 $f_s$ 嵌入到一个二维的矢量 $(q_1,q_2)$ 中，其作用是预测这两个图像属于同一类型的可能性，并且， $q_1 + q_2 = 1$ 。如说输入图像恰恰是相同类型，此时 $q_1 = 1$ 而 $q_2 = 0$ (或者有其他表示方式)。

D.正则项

在鉴别模型中，平方层被用来比较两个输入图像的特征平方之间的差距有多大，我们希望相似的图像对能够在距离上表现得小一点，而不太相似的对能有比较大的距离。收到文献^[26]的启发，我们使用了特征嵌入f₁和f₂，计算了给出训练样例(x_i,x_j)的欧式距离，距离的计算被如下定义：

$D(x_i,x_j) = ||f_i - f_j||_2^2 \tag{5}$
我们设置了一个边缘参数 τ 把相似的图像对从不相似的图像对中区别出来，作用在特征空间上。如果(x_i,x_j)来自于相同的场景，它们的特征距离应该比参数 τ 小得多，如果来自不同的场景，距离值就应该比参数 τ 大很多。给出的一个训练样例(x_i,x_j)，其目标表达应为(y_i,y_j)。我们的距离应该这么算：

$\begin{cases}D(x_i,x_j) < τ,\quad y_i = y_j\\\\D(x_i,x_j) > τ,\quad y_i \neq y_j\end{cases}$

和文献^[26]中所做的不同，我们的模型只致力于通过参数 τ 把来自于相同场景输入对的特征距离进行最小化，这比起文献^[26]中所做的度量学习正则化来说，变得简单了一些，所以我们对于距离Loss和正则化都有一定的优化，这样算：

$Dist(f_1,f_2) = \sum_{i,j}^n D(x_i, x_j) , \qquad D(x_i,x_j) < τ\tag{6}$
总结一下，我们的暹罗卷积神经网络被训练用来最小化三个Loss，包括三个交叉熵Loss和一个距离Loss，这种结合增强了我们模型学习判别特征，所以相同场景的图像距离值尽量小，而不同场景的图像则距离尽可能远。

EZ | 在遥感场景分类中使用的暹罗卷积神经网络 | 02
II.方法 A.所推出方法的概览 Fig.1展示了暹罗神经网络的总体结构，使用了神经网络作为基础模型，它由几个层组...
EZ | 在遥感场景分类中使用的暹罗卷积神经网络 | 01
Siamese「0」 Convolutional Neural Networks for Remote Sensi...
EZ | 在遥感场景分类中使用的暹罗卷积神经网络 | 03
III. 实验研究为了验证我们推出的模型的有效性，我们在三个广泛使用的数据集上做了实验，数据集分别是：NWPU-...
EZ | 在遥感场景分类中使用的暹罗卷积神经网络 | 04
引用 [1] A. Oliva and A. Torralba, Modeling the Shape of th...
基于CNN的遥感图像场景分类(一）
本文希望实现一个简单的卷积神经网络结构，用于遥感图像的场景分类，作为在遥感数据上进行深度学习的入门实践此次实践...
keras 例子
基于多层感知机的softmax分类 MLP二分类卷积神经网络使用LSTM的序列分类使用ID卷积的序列分类
task8
文本分类使用双向循环神经网络使用卷积神经网络->TextCNN TextCNN 模型主要使用了一维卷积层和时序...
文本分类；数据增强；模型微调 2020-02-25
文本分类文本情感分类数据集使用循环神经网络进行情感分类使用卷积神经网络进行情感分类文本分类是自然语言处理的一...
TensorFlow2.0--卷积
一、什么是卷积？必须在深度学习场景中使用卷积才能创建卷积神经网络。使用Fashion MNIST数据集为时尚商品...
二维卷积运算
卷积神经网络是含有卷积层（convolutional layer）的神经网络。本章中卷积神经网络均使用最常见的二维...