Ma T, Xiao C, Zhou J, et al. Drug similarity integration through attentive multi-view graph auto-encoders[J]. arXiv preprint arXiv:1804.10850, 2018.
摘要相关
药物相似相的研究对于支持下游的临床任务,如从已知的特性推断新药物的副作用、适应症和相互作用有着很大的推进。随着新型药物特征的日益普及,为学习更全面和准确的相似性带来了新的机会。本文提出从多种类型的药物特征中学习较为准确和可解释的相似性度量方法。具体来说,本文使用多视图图自动编码器对集成进行建模,并添加了注意机制来确定每个视图对应于相应任务和特征的权重,以获得更好的可解释性。
- 将药物的每个特征看做一个视图
- 使用多视图GAE来整合学习药物的相似性
- 对于单个视图使用GCN编码节点特征和边
- 视图之间则使用基于注意力的选择方案进行非线性融合
模型浅析
本文以药物的每个特征表示作为一个视图。给定视图,以每个药物为节点,以两节点之间的相似性作为边。可以得到每个视图的节点特征嵌入表示,以及样本对之间的相似性。给定个不同的视图,多视图相似性整合任务是在全视图中得到统一的节点嵌入和相似性矩阵。
-
Similarity Integration with Attentive Multi-view Graph Autoencoders
并使用两层的GraphCNN来学习节点嵌入表示: 对应的权重矩阵。对于得到的,以拼接的方式得到新的节点表示。两个节点之间的连接预测由sigmoid函数得到。
基础的多视图GraphCNN结构
给定视图,视图的邻接矩阵和对角阵定义如下:
相似矩阵的融合
该融合的目的是得到一个多视图统一的图矩阵。
步骤为:
(1)对每个相似性矩阵进行标准化
(2)邻接矩阵整合, 是融合的权重。
(3)使用一层GraphCNN去编码图中的节点 (4)并将嵌入表示进行解码以重构原始的输入空间
在没有数据标签的情况下,可以使用auto-encoder的重构损失进行约束 在这种情况下,本文的框架可以看作是一种无监督的多图融合和嵌入方法。所导出的相似度矩阵也可以用于其他任务,如节点聚类。
基于注意力的视图选择
假设当前视图的邻接矩阵为,本文给每个视图都分配一个注意力权重。整合后的邻接矩阵表示为,是元素的对应相乘。对于每个视图,首先每个原始的邻接矩阵被映射为一个非正则的矩阵,然后对其进行正则化得到。为了降低计算的复杂度,本文将的邻接矩阵替换为一个对角的注意力矩阵。具体来说,将限制为一个向量,并通过diag形成加权相似度矩阵。
进一步的,将注意力权重进行归一化
被用于得到最后的相似性矩阵 diag()是由其生成的对角矩阵。 -
A Semi-supervised Extension Given Partial Labeled Data
其中
由得到的进行节点连接关系的预测,将标签数据应用到模型的训练中:
为了进一步在重构的过程中也考虑图的拉普拉斯正则,将前面替换为带有权重的图结构正则。表示为,该目标函数用GAE的重建损失取代了第二项,也显式地建模了图的结构信息。
总的来说没有新的操作,可能也是因为这是18年的论文。但是想法很巧妙,对A矩阵的操作可以更好的挖掘节点之间的连接关系。
网友评论