一句话总结:【边预测问题】结合二阶相邻图网络预测分子间相似性
Motivation
一般的图神经网络只计算了相邻节点的相似性,但在生物网络中,不直接相连的节点的相似性也会对预测结果产生重要影响。
图1:直接相似性和跳跃相似性
如图1,一般来说,节点A和节点B之间有边相连说明它们是相似的,反之亦然。但是在分子交互网络中,直接相连的实体不是一定相似。不直接交互的节点之间的间接相似性(比如二阶相邻的),已被证明在各种分子网络中有重要作用。比如在一个DTI网络中,药物A和药物B都直接和一个target相连,因此这两个药物是相似的,但是一个药物和一个target并不相似。
这篇论文基于上述概念引入了skip similarity,描述两个节点间的二阶相互作用。
Method
SkipGNN利用原始分子网络二阶相邻网络来预测新的分子相互作用。
图2:SkipGNN网络结构
Skip graph 的构建
SkipGNN构建了新的跳跃图(skip graph),在原图G中二阶相连的邻居在中用边连接,从而可以得到这个skip graph的邻接矩阵:
迭代融合(Iterative fusion)
为了使模型在训练时自动结合direct similarity和skip similarity的信息,产生最终的node embedding。作者同时训练和两张图,使它们互相影响,迭代更新权重,如图2和下方公式所示。
在每一轮的迭代中,node embedding的更新顺序如下:
先结合和得到,再根据和更新。
最终的node embedding由下式产生:
这里作者没有选择简单的拼接。
SkipGNN decoder
首先得到要预测的节点对(i,j)的node embedding ,使用直接拼接、加和等方式得到一个embedding作为decoder的输入,最后这个combined embedding送入一个二分类神经网络来获得(i,j)有相似性的概率:
SkipGNN 算法流程
图3:SkipGNN算法Result
比较有趣的部分是SkipGNN 在异构图上可以学到有生物意义的embedding spaces。如图4,在作者使用的DTI数据上,传统GCN不能区分药物和target,但是SkipGNN可以把两者较好地区分开。
如图5,在gene-disease interaction网络上,也有类似的结果。
图5:基因-疾病网络可视化
原文Link: SkipGNN: Predicting Molecular Interactions with Skip-Graph Networks
网友评论