Network Embedding_LINE

作者: 吹洞箫饮酒杏花下 | 来源:发表于2018-08-30 20:34 被阅读0次

Network Embedding_LINE
Network In Network
Network In Network
network in network
Network In Network
[翻译]Network In Network
《Network in network》理解
docker network 基本命令
Docker network命令详解
Fallacies of Distributed Computi

输入：网络图输出：节点的向量表示适用范围：大规模（百万的顶点和数十亿的边）的任意类型的网络：有向或无向、有权或无权。文章中只提到可以扩展到规模很大的网络，小规模网络应该也可以。

First-order Proximity（一阶相似度）：两个顶点之间的自身相似（不考虑其他顶点）。对于由边（u，v）连接的每一对顶点，边上的权重w(uv)表示u和v之间的相似度，如果在u和v之间没有观察到边，则它们的一阶相似度为0。一阶邻近通常意味着现实世界网络中两个节点的相似性。例如，在社交网络中相互交友的人往往有着相似的兴趣;在万维网上相互链接的页面倾向于谈论类似的话题。

Second-order Proximity（二阶相似度）：网络中一对顶点（u，v）之间的二阶相似度是它们邻近网络结构之间的相似性。 在数学上，设pu=（wu，1，...，wu，| V |）表示u与所有其他顶点的一阶相似度，则u和v之间的二阶相似度由 pu和pu决定。如果没有顶点与u和v都连接，则u和v之间的二阶相似度为0。

因为有些边观察不到等原因，一阶相似度不足以保存网络结构。因此提出共享相似邻居的顶点倾向于彼此相似，即二阶相似度。例如，在社交网络中，分享相似朋友的人倾向于有相似的兴趣，从而成为朋友; 在词语共现网络中，总是与同一组词语共同出现的词往往具有相似的含义。

最优化目标：

1）只保留一阶相似度的LINE模型（一阶相似度只能用于无向图，不能用于有向图。）

顶点 Vi ,Vj 。分别对应向量Ui,Uj。 Wij: 边的权值。

最小化目标：两个概率分布的KL散度。两个概率为：经验概率（边的权值得到）和联合概率（向量计算得到）。已经经过化简，去掉了常数项。

联合概率

2）只保留二阶相似度的LINE模型（每个节点，两个向量表示）

每个顶点扮演两个角色：顶点本身和其他顶点的邻居。因此，为每个节点引入两个向量表示ui和ui`：ui是vi被视为顶点时的表示，ui`是当vi被视为特定邻居时的表示。

最小化目标：两个概率分布的KL散度。两个概率为：经验概率（边的权值得到）和联合概率（向量计算得到）。已经经过化简，去掉了常数项。

表示，vj是vi的邻居的概率。其中，|V|是网络中顶点的数目。

参考：https://www.jianshu.com/p/82b9c88a23ad

https://www.jianshu.com/p/8bb4cd0df840

https://www.ccir2017.cn/attachments/oral%20report/3_17_%E5%9F%BA%E4%BA%8E%E7%BD%91%E7%BB%9C%E8%A1%A8%E7%A4%BA%E5%AD%A6%E4%B9%A0%E7%9A%84%E4%B8%AA%E6%80%A7%E5%8C%96%E5%95%86%E5%93%81%E6%8E%A8%E8%8D%90_%E6%96%B0%20.pdf