在目前的基于图结构的多标签图像分类方法中,图神经网络和超图神经网络都是用于学习多标签之间的标签依赖关系的方法。那么这两种方法在学习标签之间的依赖关系上有什么对比优势?本文尝试简要分析。
首先需要简单介绍图神经网络和超图神经网络的网络结构:
1.图神经网络
图神经网络结构
对于每个标签类别,首先通过外部知识(通常是通过词向量模型)获取初始的词向量,每个标签类别作为图中的一个结点,结点的初始表示就是对应的标签的词向量。然后,通过公式:
进行图卷积的操作,其中,A是一种邻接矩阵,H是结点的向量表示,W是一个转换矩阵(用于对H进行升维或降维)。这样的卷积过程能够使每个结点有选择地与自己的相邻结点交换信息。而卷积的次数是当前结点能够获取的最远结点信息的最大跳数。整个卷积的过程能够使得有明确语义关系的结点学习到相似的向量表达,即它们在空间中具有更高的相似性。
2.超图神经网络
超图神经网络
超图神经网络与图神经网络很不同的一点是他的结构表示。超图的矩阵表示和图不一样,不再是结点和结点的关系,而是边和结点的关系。即每条边有几个结点,或者说当前结点属于哪几条边。而且,超图神经网络的卷积过程相比图神经网络的复杂:
Dv和De表示的分别是结点的度和边的度,用于归一化。HA是自适应一致性矩阵(边X点),W是一个对称矩阵,代表了边的权重。F是结点向量表示,Θ用于维数转化(升维降维)。
超图神经网络相比于图神经网络的有个最大的不同在于,他能够学习到high order的向量表示,举个例子,对于图神经网络来说,他能学习到狗和人以及猫和人的依赖关系,而超图神经网络能学习的是猫,人,狗三者的关系。
网友评论