1. DeepWalk
time: 2014
![](https://img.haomeiwen.com/i1500965/3a9258621431521f.png)
对图从一个节点开始使用random walk来生成类似文本的序列数据,然后将节点id作为一个个「词」使用skip gram训练得到「词向量」。
2. LINE
![](https://img.haomeiwen.com/i1500965/3e9b2195d0cb4853.png)
LINE分析了1st order proximity和2nd order proximity,其中一度相似性就是两个点直接相连,且边权重越大说明两个点越相似,如图中的6和7;而二度相似性则是两个点之间共享了很多邻居,则它们的相似性就很高,如图的5和6。
2.1 LINE with First-order Proximity
联合概率分布:![](https://img.haomeiwen.com/i1500965/0733370ece6230ca.png)
经验概率分布:
![](https://img.haomeiwen.com/i1500965/fcd3e92e0026be93.png)
最小化联合概率分布和经验概率分布:
![](https://img.haomeiwen.com/i1500965/1ac689625c60511d.png)
2.2 LINE with Second-order Proximity
联合概率分布:
![](https://img.haomeiwen.com/i1500965/cce4a2b07b7c2dd4.png)
经验概率分布:
![](https://img.haomeiwen.com/i1500965/b94c6cd9e2dc95db.png)
最小化联合概率分布和经验分布:
![](https://img.haomeiwen.com/i1500965/21aa2856d59116ac.png)
3. node2vec
![](https://img.haomeiwen.com/i1500965/e24c995e030a5b4d.png)
DeepWalk中根据边的权重进行随机游走,而node2vec加了一个权重调整参数,最终生成的随机序列是一种DFS和BFS的结合,模型仍使用skip gram去训练。
![](https://img.haomeiwen.com/i1500965/a2b7f39e59a362c2.png)
网友评论