如果说CNN是针对图像数据那样的规则数据,有具体的应用场景,那么GCN则是其泛化可以针对所有的应用场景。
在数学上,统一是一种的美感,泰勒曾经提出所有的非线性函数都可以由无穷多个幂函数相加拟合而成。由于GCN适合更为广泛的非欧几里得数据,其也具有同样的美感。
但是在,具体推导到一般的过程中往往都是充满了各种挑战的。在这里,GCN分为了两个不同的学派:空间域学派、频率域学派。空间域学派的想法与传统CNN相近。CNN中对局部特征进行聚集操作,而对于非欧几里得数据,统一的卷积核是失效的。但如果抓住卷积是对某点与其周围点的聚合这一本质,则非欧几里得数据上的“卷积"也就有了可能,无非就是通过聚合的方式(也就是于某节点于其周围的所有节点对应的数值进行相加)。剩下的无非就是判断到底多邻近的点才算是某点的邻近节点、通过什么样的方式来相加等细节问题,万变不离其宗了。
而另一个学派是频率域学派,其认为既然在空间域上图结构是不规则的非欧几里得数据,那么可以将不规则的空间结构转换到规则的欧几里得数据上(也就是频率域上)。接着在规则的频率域数据上进行标准的卷积运算,运算完成后再次转换到空间域上就可以了。这种变换的方式在图像处理领域是很常见的,包括一些常用的PCA方法也用到了类似的思想。
学GCN时,我认为学术界的人非常聪明,当遇到不熟悉的问题时,一种人能够将手里的工具进行改造以适应当前的任务,另外一种人能够将当前不熟悉的问题通过某种方式转换到自己熟悉领域的等价问题,再用工具箱的常规工具进行处理。生活中也应该有这样的智慧,共勉。
网友评论