美文网首页
Hadoop Page Rank

Hadoop Page Rank

作者: 98Future | 来源:发表于2017-11-04 05:28 被阅读0次

    Page Rank实现本质也是矩阵相乘

    Idea: 用Transition Matrix 乘 initial population on each website. 得到的就是下一个state 的population on each website. 不断调用transition matrix, 最后各个网站人数会趋近stable。

    unitState表示time of convergence 我们可以自己定。

    调用multiplication.main() on Page Rank matrix.

    然后再Sum on unitMultiplication Result.

    Multiplication:

    PRmapper 给的是当前state上的人数 pr[0] = web name, pr[1]=population

    MultiplicationReducer=<网站B, 从网站A这次来B的人数>

    //Sum

    KEY IDEA:

    从1去到a,b,c,d

    每个占比1/4!

    相关文章

      网友评论

          本文标题:Hadoop Page Rank

          本文链接:https://www.haomeiwen.com/subject/ufffmxtx.html