美文网首页算法小白菜
DeepWalk学习笔记

DeepWalk学习笔记

作者: 林桉 | 来源:发表于2021-03-09 21:17 被阅读0次

DeepWalk的输入是一张图或者网络,输出为网络中顶点的向量表示。DeepWalk通过截断随机游走(truncated random walk)学习出一个网络的社会表示(social representation)


image.png

前提假设

随机游走的分布规律与NLP中句子序列在语料库中出现的规律有着类似的幂律分布特征。那么既然网络的特性与自然语言处理中的特性十分类似,那么就可以将NLP中词向量的模型用在网络表示中。


image.png

优化目标

image.png
image.png
image.png
  • 映射函数选取
image.png

忽视顶点顺序,更好地表达顶点临近关系,只需要计算一个顶点的向量。

skip-gram

image.png

Hierarchical Softmax解决迭代计算量庞大的问题。
Huffman编码是一种熵编码方式,对于出现频率高的符号用较短的编码表示,出现频率较低的符号用较长的编码表示,从而达到编码压缩的目的。Hierarchical Softmax树也可以采用Huffman编码的方式生成,高频词用较短的路径到达,低频词用较长的路径到达,可以进一步降低整个训练过程的计算量。


image.png

伪代码

image.png

截断随机游走

image.png

随机游走长度固定。根结点vi,随机路径Wvi。

注意的点

  • 适应性,网络表示必须能适应网络的变化。
    网络是一个动态的图,不断地会有新的节点和边添加进来,网络表示需要适应网络的正常演化。
  • 属于同一个社区的节点有着类似的表示。网络中往往会出现一些特征相似的点构成的团状结构,这些节点表示成向量后必须相似。
  • 低维。
    代表每个顶点的向量维数不能过高,过高会有过拟合的风险,对网络中有缺失数据的情况处理能力较差。
  • 连续性。
    低维的向量应该是连续的。

参考

w2v: https://www.jianshu.com/p/3217e8c00549
文献:https://arxiv.org/pdf/1403.6652.pdf
https://zhuanlan.zhihu.com/p/45167021
slide:http://www.perozzi.net/publications/14_kdd_deepwalk-slides.pdf

相关文章

  • DeepWalk学习笔记

    DeepWalk的输入是一张图或者网络,输出为网络中顶点的向量表示。DeepWalk通过截断随机游走(trunca...

  • DeepWalk学习

    DeepWalk Background 使用机器学习的算法解决问题需要有大量的信息,但是现实世界中的网络中的信息往...

  • Graph Embedding之DeepWalk

      DeepWalk是一种用来学习图(网络)中顶点的潜在表示的一种基于简单神经网络的算法。DeepWalk 算法第...

  • win10下DeepWalk安装配置运行中遇到的问题

    最近在做NE方面的毕业论文,慢慢摸索,先看了DeepWalk的论文《DeepWalk:Online Learnin...

  • DeepWalk

    1.背景 DeepWalk是一种学习网络中节点的隐式表征的新颖方法。这些隐式表征把社会关系编码到统计模型易于使用的...

  • DeepWalk

    Random Walk and Word2Vec

  • Deepwalk

    random wlak:就是在网络上不断重复地随机选择游走路径,最终形成一条贯穿网络的路径。从某个特定的端点开始,...

  • DeepWalk

    转载自【Graph Embedding】DeepWalk:算法原理,实现和应用 - 浅梦的文章 - 知乎https...

  • NLP(二)学习《DeepWalk: Online Learni

    0 介绍 DeepWalk把图作为输入,把生成的潜在表示作为输出。DeepWalk通过随机游走获得结构规律。 1 ...

  • 论文笔记之DeepWalk: Online Learning o

    原文:DeepWalk: Online Learning of Social Representations 基本...

网友评论

    本文标题:DeepWalk学习笔记

    本文链接:https://www.haomeiwen.com/subject/vjayzktx.html