0. 总结目录
1. 背景
•根据IBM前首席执行官郭士纳的观点,IT领域每隔十五年就会迎来一次重大变革
WAVES.png(我个人觉得第四次浪潮可能是人工智能和去中心化区块链)
2. 大数据的概念
大数据不仅仅是数据的大量化,而是包含快速化,多样化和价值化等多重属性。
2.1 数据量大;人类在最近两年产生的数据量相当于之前产生的全部数据量
2.2 数据种类繁多,只有10%是结构化数据,存储在数据库中;90%是非结构化数据,它们与人类信息密切相关。
2.3 处理速度快:
a) 从数据的生成到消耗时间,窗口非常小,可用于生成决策的时间十分少。
b) 一秒定律,这一点也是和传统的数据挖掘技术有着本质的不同.
2.4 价值密度低,商业价值高:以视频为例,连续不断监控过程中,可能有用的数据仅仅是一两秒,但是具有很高的商业价值。
3. 大数据的影响
- 在科学研究上,先后历经了实验、理论、计算和数据四种范式
-
在思维方式方面,大数据完全颠覆了传统的思维方式:
–全样而非抽样
–效率而非精确
–相关而非因果 -
个人感想:
大数据可能会影响到生活中的每一个方面,因为无论是机器学习,或是人工智能,算法的准确性上升主要是因为数据量上升。在大数据真正应用后,科学不再像以前那样是先提出问题,然后再去验证;而是反过来,而是从大量的数据中得到推理和结论,然后再反向论证。随着各种传感器的普及,人类社会中非结构化数据不断上升,大数据加人工智能应该会发生一些很有趣的结果。因为新的科学定理发现之后会应用到全人类生产和生活里。
这样带来一个很大的问题,就是过去20多年来,基础学科验证方法可能全部都要推翻。做实验的方式完全不一样,未来可能每个人都需要学习计算机技术以及大数据,然后再细分行业去做实验。
4.大数据关键技术
分布式存储和分布式处理
tech.png
5. 大数据计算模式
product.png个人总结:针对不同的应用场景,需要用到不同的工具。而且每个工具的核心应该不太一样,因为要处理的算法跟方式不一样的。
6. 云计算
这些云的目的其实就是即开即用啦,按需租借。
cloud.png2018.06.05 学习笔记
林子雨老师的 《 大数据技术原理与应用》
中国MOOC上有课,但是我交不了作业了QAQ,太晚遇见这个课程了。
网友评论