美文网首页数据科学
我也聊聊大数据

我也聊聊大数据

作者: sparkshen | 来源:发表于2020-02-15 22:45 被阅读0次

声明:以下内容未经严格考证

其实关于什么是大数据,一般大家想要理解,会去找各种网页,各种图书。看完之后,当场总是觉得很嗨,睡一觉就又什么都不记得了。

当年谢逊和张翠山一家从冰火岛往中原出发,有个桥段:狮王一路上教导无忌一定要熟记七伤拳口诀。无忌年幼,并不知口诀倒是哪般神功,只知熟记于心。这般学法,日后倒真的是助了他武学精进。


说回大数据,从前,某歌说,我要用我的闲散机器,处理我海量数据,于是有了map-reduce。这块山头,由此立下。有好事者,依葫芦画瓢弄出个hadoop。

不得不说,摩尔定律无处不在,真好象是暗空间的硅基生物,一刻不停的往前疯狂进化。过了没多久,大数据的世界,便进化出了spark,数据处理速度何止是hadoop的100倍。

猛然,大家发现,原来几个T的数据,也跟玩excel差不多难度。一个新的数据宇宙就此打开。所谓 数据结构+算法的世界,在各种智能算法面前,就好像远古生物一般。

另外一边,一个叫python的编程语言,预先构建了向量/矩阵计算能力。人们发现,如果能将python的这种特殊能力,用来处理庞大的TB级别的数据,那数据里面蕴藏的各种特征值,就能更容易的被当成金矿挖出来。

map-reduce原语,spark计算平台,python科学计算,当这三兄弟不期而遇的时候,天空劈下一道耀眼的闪电 - tensor-flow诞生了。

那么提问:

1. 请用python实现一个map-reduce版本的word-count

2. 用python,再spark平台上,用拟牛顿法实现求解平方根

3. 请用python分析下,titanic号上遇难的船员中,哪一类人存活率最高?

如果你能回答这三个问题,那么恭喜你,谢老前辈的口诀,你已经得到了。

相关文章

  • 我也聊聊大数据

    声明:以下内容未经严格考证 其实关于什么是大数据,一般大家想要理解,会去找各种网页,各种图书。看完之后,当场总是觉...

  • 我也聊聊写作

    在简书上我一直在追一位作者——别山举水。来到简书是偶然,遇见别山老师更是偶然。 初读老师的文就一头扎进去了,不过简...

  • 我也聊聊金庸

    金庸和古龙是不同风格的人,他在心里面是大侠,首先是他小说人物很正气,传达的是大侠风范。 第二个让我敬佩的是,他的家...

  • 我也聊聊锁

    最近在首页翻到了几篇文章,都是在说锁文的事情。有吐槽的,有提出解决方案的,有宣布要离开某书的。。。。 在德国,起初...

  • 我也聊聊蚊子

    今年家里蚊子不是很多,不知为什么楼道里蚊子却不少,每次开门进出,总会漏进来一只两只。 领导在家的日子,眼里是容不得...

  • "大数据"到底颠覆了什么?

    今天,主要是想来聊聊传统大企业大数据进程缓慢的问题。诚然,大数据这脱胎于互联网的技术和思路,同很多传统大企业...

  • 数据治理专题7

    上期聊到反洗钱数据治理体系分了6大方面,其中数据需求、数据架构和模型、数据质量最为关键。 本期聊聊其中最为重要的内...

  • 初步理解大数据

    先来聊聊大数据的几个特征: 数据来源广,数据格式多样,数据量大(至少也得是TB级别的),数据增长速度快。 数据来源...

  • 我也来聊聊《COCO》

    《COCO》,中文片名《寻梦环游记》,自上映以来口碑非常好,目前豆瓣评分已高达9.2。只是这个中文片名不够贴切。...

  • 我也聊聊中国男足

    印象中,我已经有十几年不看中国男足的比赛了。 一是怕给自己添堵,二是怕浪费自己宝贵的时间。昨晚10点,我冒...

网友评论

    本文标题:我也聊聊大数据

    本文链接:https://www.haomeiwen.com/subject/ejjufhtx.html