Deep Anomaly Detection on Attributed Networks
提出了DOMINANT(Deep Anomaly Detection on Attributed Networks)用于graph上的异常检测,核心想法:1)用GCN综合graph的结构信息和节点属性信息来获得节点的embedding。2)通过autoencoder来重构original data从而检测出异常节点。
文中指出网络中的异常节点由网络的拓扑结构和节点属性共同决定。
文中把属性图上的异常检查定义为一个ranking问题,即根据异常的程度评分排序。
The Proposed Model - Dominant
Dominant由三部分组成:
1)attributed network encoder. 通过GCN综合网络结构信息和节点属性信息来获得节点的embedding。
2)structure reconstruction decoder. 通过节点的embedding重构网络拓扑结构。
3)attribute reconstruction decoder. 通过节点的embedding重构节点属性。
最终通过重构误差来评判节点的异常程度。
Attributed Network Encoder
文中使用了GCN来作为encoder,同时考虑了网络结构信息和节点属性信息。
Structure Reconstruction Decoder
用A~ 表示重构的邻接矩阵,结构重构误差Rs=A-A~ .(Rs是一个矩阵)
这里的想法是,如果一个节点的连接关系不能被很好的重构,说明它的结构信息不符合大多数正常节点的pattern。
Rs(i,:)表示Rs的第i行对应的向量,即node i对应的结构信息。如果该向量的2范数越大,说明从拓扑结构的角度,节点i是异常节点的概率更高。
文中预测节点i和节点j之间是否有link使用的是node i的embedding与node j的embedding的内积加sigmoid,内积本质就是近似的相似度,即node i与node j的latent representation越像,越有可能有link.
于是有
Attribute Reconstruction Decoder
和带conv层的autoencoder一样,conv的逆操作仍然是conv。
因此,使用另一个图卷积层来预测原始的节点属性
重构误差为RA=X-X~.
Anomaly Detection
最终的目标函数定义为
α为超参数。
完成模型的训练后,通过每个节点的重构误差,来衡量其异常程度。
节点vi的异常score定义为
最后,对所有节点的异常score做ranking,得到各个节点的异常程度。
网友评论