案例4-优化Page-Rank算法

案例4-优化Page-Rank算法

作者: 7125messi | 来源:发表于2018-01-14 14:11 被阅读15次

案例4-优化Page-Rank算法
010_scala编程详解数组操作之数组转换
KNN算法-4-算法优化-KD树
优化方法总结
网易微专业-机器学习工程师百度网盘分享
算法踩坑6-二叉搜索树排序
腾讯广告算法大赛随手记-目录
优化器
算法踩坑5-归并排序
8. 优化案例

partitionBy()函数优化RDD Joining

pageLinks =  [['a' ,['b','c','d']],
               ['b', ['d','c']],
               ['c', ['b']],
               ['d', ['a','c']]]
pageRanks =  [['a',1],
               ['b',1],
               ['c',1],
               ['d',1]]

numIter = 20

pageRanksRDD  = sc.parallelize(pageRanks, 2).partitionBy(2,hash).persist()
pageLinksRDD  = sc.parallelize(pageLinks, 2).partitionBy(2,hash).persist()
s = 0.85

def rankContribution(uris, rank):
     numberOfUris = len(uris)
     rankContribution = float(rank) / numberOfUris
     newrank =[]
     for uri in uris:
             newrank.append((uri, rankContribution))
     return newrank

for i in range(numIter):
         linksRank = pageLinksRDD.join(pageRanksRDD)
     contributedRDD = linksRank.flatMap(lambda x : rankContribution(x[1][0],x[1][1]))
     sumRanks = contributedRDD.reduceByKey(lambda v1,v2 : v1+v2)
     pageRanksRDD = sumRanks.map(lambda x : (x[0],(1-s)+s*x[1]))
 
pageRanksRDD.collect()

输出结果：
[('b', 1.357243795127982),
('d', 0.8746512999550939),
('a', 0.5217268024809147),
('c', 1.2463781024360086)]

相关文章

案例4-优化Page-Rank算法
partitionBy()函数优化RDD Joining 输出结果：[('b', 1.35724379512798...
010_scala编程详解数组操作之数组转换
使用yield和函数式编程转换数组普通算法算法案例：移除第一个负数之后的所有负数优化算法
KNN算法-4-算法优化-KD树
KD树 KNN算法的重要步骤是对所有的实例点进行快速k近邻搜索。如果采用线性扫描（linear scan），要计算...
优化方法总结
优化算法框架神经网络模型中有多种优化算法，优化算法的作用用来优化更新参数。对于优化算法而言，主要的框架如下。参数...
网易微专业-机器学习工程师百度网盘分享
课程大纲：导论机器学习介绍与算法一览算法与案例：线性回归与逻辑回归算法与案例：树模型算法与案例：支持向量...
算法踩坑6-二叉搜索树排序
背景接上面五篇文章算法踩坑-快速排序算法踩坑2-插入排序算法踩坑3-堆排序算法踩坑4-冒泡排序 ...
腾讯广告算法大赛随手记-目录
腾讯广告算法大赛随手记1含福利腾讯广告算法大赛随手记2腾讯广告算法大赛随手记3腾讯广告算法大赛随手记4-全局思路腾...
优化器
优化器（optim）优化算法模块(torch.optim) torch.optim 实现了丰富的优化算法，包括S...
算法踩坑5-归并排序
背景接上面四篇文章算法踩坑-快速排序算法踩坑2-插入排序算法踩坑3-堆排序算法踩坑4-冒泡排序来...
8. 优化案例
1. 十大经典算法及其优化2.几种常见的优化算法3. 经验之谈：优化算法两句话精炼总结

网友评论

pyspark学习

本文标题：案例4-优化Page-Rank算法

本文链接：https://www.haomeiwen.com/subject/pfpkoxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

pyspark学习

关于我们|服务条款|联系我们|案例4-优化Page-Rank算法|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！