大数据分析，鲁班为祖师

作者: i败火 | 来源:发表于2017-04-17 17:24 被阅读605次

大数据分析，鲁班为祖师
柴绍的弟弟表演绝技，唐太宗说：这人不能留在京城
技从祖师来，薪火永相传（1）
木工祖师——鲁班。
商人祖师全能天才陶朱公
2018-09-29
Spark分布式大数据分析平台安装与配置
启秃杂谈·正本清源论备胎
老祖宗的讲究：凳不离三，门不离五，床不离七，桌不离九
如何做用户行为分析？

题图

1.《全栈数据之门》现货上架

经过一段时间的等待，目前已经可以在各大电商平台『现货』购买本书。
本文后面也有京东、当当、天猫的购买链接！

本书适用

本书以数据分析领域最热的Python语言为主要线索，介绍数据分析库Numpy、Pandas与机器学习库Scikit-Learn，使用了可视化环境Orange3来理解算法的一些细节。
对于机器学习，既有常用算法KNN与Kmeans的应用，决策树与随机森林的实战，还涉及常用特征工程与深度学习中的自动编程器。
在大数据Hadoop与Hive环境的基础之上，使用Spark的ML/MLLib库来集成了前面的各部分内容，让分布式机器学习更容易。大量的工具与技能实战，从而将各部分融合成为一个全栈的数据科学内容。

2. 大数据分析，鲁班为祖师

该节选自《全栈数据之门》第四章『数据分析，见微知著』的引言部分！

如果你要问大数据分析最早起源于哪里，答案自然是有着5千年悠久历史的中国了。若君不信，且看下面的说明。

大数据

有一颗树，非常非常大，一个人搬不动，于是鲁班发明了锯子，将树锯成很多小节，然后找很多人来帮忙搬，这样不仅速度快，而且效率高。此所谓“大树锯”是也。这样一传十，十传百，传到其它国家，大家讹传讹，就变成了“大数据”。

分布式存储

为了保证高可用性，鲁班教了大家一个好方法。将同样的木料，分3份保存，自己家放一份，邻居家放一份，邻村里面再放一份。如果自己家被烧了，还可以使用邻居家的那份。如果整个村子被水湮（或者像现在电视剧里演的一样，在古代可能会一不小心被灭村），还有邻居村子的那份可以使用。

知识星球.jpeg

数据分析
将树锯断后，分成一小节一小节的，统计每节的长度，面积等等。分析木料是否有被虫咬过，以及如何防止其它树也被类似的虫咬。分析树每年的增长幅度，以及每天需要投入多少水资源来促进树的快速增长。

数据挖掘

鲁班通过分析树干上面的纹理，发现了树的年轮规律，这样可以快速了解树生长了多少年。这个方法被鲁班建立成了一个模型，用于预测其它树每年的生长速度。另外，还将树根“挖掘”出来，分析为什么这个地方能产生这么大的树，和土地是否有关系，土壤的成分是什么，能否将这种土壤移植到其它地方等等。总之，是真正的进行了数据的“挖掘”。

因此，大数据分析技术不仅起源于中国，而且其祖师正是木工艺人的祖师--鲁班。

一本正经的胡说八道了这么多，相信你对数据分析有了一个初步的了解吧。
欲了解更多的内容，请关注下面购买地址。

3. 网站购买地址

京东：
https://item.jd.com/12054675.html
当当：
http://product.dangdang.com/24220962.html
天猫：
https://detail.tmall.com/item.htm?spm=a220m.1000858.1000725.41.4dyUqr&id=547017469621&user_id=217042976&cat_id=2&is_b=1&rn=2a8225201adc37502d935cfdd15cf5a5

4. 一些信息

博文视点：
http://www.broadview.com.cn/book/154
豆瓣：
https://book.douban.com/subject/26998034/
百度百科：
http://baike.baidu.com/item/全栈数据之门/20490226

本文题图取自《全栈数据之门》的封底，使用的是Orange3制作的数据挖掘流程『演示』图。

知识星球.jpeg

网友评论

本文标题：大数据分析，鲁班为祖师

本文链接：https://www.haomeiwen.com/subject/sbntzttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！