首发于公众号“浊酒清味”
你听说过集体智慧编程这本书吗?
看到这个名字是不是不知所云?
然而去豆瓣看了一眼,下了一跳:

一千多人评分在科学书籍范围内已经算很高的,而且还是9.0分的高分。
那么它到底是何方神圣呢?
这本2009年出版的书的主题是机器学习和统计算法,你可能会问这都9102年了,莫不是个老古董,还有必要看吗?这个问题,我们留在最后回答。
先看看这本的具体内容吧:
专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。
这些都是经典算法,简直就是练手的宝贝。而且是用Python代码编程,结合原代码学习那是相当舒服。
我们扫一眼作者的信息:
Toby Segaran是Genstruct公司的软件开发主管,这家公司涉足计算生物领域,他本人的职责是设计算法,并利用数据挖掘技术来辅助了解药品机理。Toby Segaran还为其他几家公司和数个开源项目服务,帮助它们从收集到的数据当中分析并发掘价值。除此以外,Toby Segaran还建立了几个免费的网站应用,包括流行的tasktoy和Lazybase。他非常喜欢滑雪与品酒,其博客地址是blog.kiwitobes.com,现居于旧金山。
去他的主页扫了一眼,发现最后的更新是2013年,莫不是退隐江湖了?

看看网友的评价吧:
(1)以具体实例的方式来展示 Python 的编程技巧,受益良多。作者用非常直观的方式向读者展示了人工智能和机器学习中的大量经典的算法。
两个字总结:经典
(2)更可贵的是,作者在展示算法时所使用的例子都是网络中非常有代表性的场景,并且很多情况下还会结合一些实际运营的 Web 站点的数据作更进步阐释。当然,作为一本实用型的书,少不了的是大量可运行的代码。
两个字总结:实用
(3)入门佳作,不懂数学也可以数据挖掘哟~~~即使API过时了还是非常好用。
四个字总结:过时但好用
这算是回答了一开始的问题吧,经典终究是经典啊。
最后的最后,当然是资源分享环节了:
提取码:qx0o
网友评论