An Efficient Similarity Search F

作者: DaydayHoliday | 来源:发表于2019-02-27 14:56 被阅读0次

An Efficient Similarity Search F
Faiss - 部署安装与Demo
2018ICDE-ULISSE:ULtra compact In
ES7.3支持语义句向量查询
【神经网络搜索】Efficient Neural Archite
Leetcode - Search a 2D Matrix
divide_and_conquer
算法题--在行列都有序的二维矩阵中查找指定元素
【CVPR】Person RE-ID文献摘要【更新中。。】
PieBridge，一个高效、小巧的基于Bundle的Andro

simRank是一种与领域无关的节点相似度评价，即它只会根据节点在图中的上下文信息来评价其相似度，而不会考虑领域知识相关的内容。其遵循的假设是“如果两个节点的相关节点是相似的，则它们就是相似的”。还有一个基本假设是相同节点之间是相似的。

simRank小例子：在图一中，G是原始图，G^2是在G的基础上构建的，其特点是节点为一对G中的节点。其构造过程为：以（Univ, Univ)为起点，对于已有的一个节点（a，b），如果a指向了c，b指向了d，则（a，b）会指向（c，d），由于相似函数应该是对称的，因此（a，b）和（b，a）被认为是一样的。

由simRank的计算公式可知，simRank的计算过程是递归的，在图1中的 $G^2$ 则表示了各节点对之间在计算过程中的依赖关系，即计算某一节点对的相似度是，会使用到所有指向它们的节点对的相似度。由图可以看出，有些点对之间的相似度可直接得出，有些则需要在别的结果的基础上得出，有的节点对之间的相似度的计算还要拿自己做输入。

simRank的计算公式

因此，有的节点之间的simRank其实是没办法计算的（但却会收敛到一个点上），而估计simRank的一个最单纯的想法便是通过一种规则不断地对每对节点的simRank值进行更新。

1.对每一对节点之间的simRank值进行初始化，如果是同一节点则为1，否则为0

2.领用上一步得到的值，通过公式对simRank进行更新。

更新算法

3.重复2直至收敛

这个过程比较简单，可以写段代码。https://www.jianshu.com/p/cde25338064c

迭代一般会在K=5时就收敛了，时间复杂度为O（K $n^2 d_{2}$ ），K是迭代次数，n是节点个数， $d_2$ 是邻居数的平均值，复杂度还是相当高，最好能优化一下，使用剪枝等。（好像剪完枝也快不到哪儿去，这段就略过吧）

对于预期距离公式：

预期距离

在公式中，要针对每一条从u到v的路径进行求和。记 $t=<w_1,...,w_k>$ ,则它的长度是k-1， $P[t]=\prod\nolimits_{i=1}^{k-1} 1/\vert O(w_i) \vert$ ，解释起来就是从 $w_i$ 到 $w_{i+1}$ 有O种选择，所以有1/O的可能性到了 $w_{i+1}$