欢迎大家评论留言发表自己的观点,大数据还需要掌握哪些知识或者技术。
基础概念
大数据的本质
一、数据的存储:分布式文件系统(分布式存储)
二、数据的计算:分部署计算
基础知识
学习大数据需要具备Java知识基础及Linux知识基础
很多初学者,对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习qq群:199427210,有大量干货(零基础以及进阶的经典实战)分享给大家,并且有清华大学毕业的资深大数据讲师给大家免费授课,给大家分享目前国内最完整的大数据高端实战实用学习流程体系
学习路线
(1)Java基础和Linux基础
(2)Hadoop的学习:体系结构、原理、编程
第一阶段:HDFS、MapReduce、HBase(NoSQL数据库)
第二阶段:数据分析引擎 -> Hive、Pig
数据采集引擎 -> Sqoop、Flume
第三阶段:HUE:Web管理工具
ZooKeeper:实现Hadoop的HA
Oozie:工作流引擎
(3)Spark的学习
第一阶段:Scala编程语言
第二阶段:Spark Core -> 基于内存、数据的计算
第三阶段:Spark SQL -> 类似于mysql 的sql语句
第四阶段:Spark Streaming ->进行流式计算:比如:自来水厂
(4)Apache Storm 类似:Spark Streaming ->进行流式计算
NoSQL:Redis基于内存的数据库
HDFS
分布式文件系统 解决以下问题:
• 硬盘不够大:多几块硬盘,理论上可以无限大
• 数据不够安全:冗余度,hdfs默认冗余为3 ,用水平复制提高效率,传输按照数据库为单位:Hadoop1.x 64M,Hadoop2.x 128M
• 管理员:NameNode 硬盘:DataNode
![image.png](http://ata2-img.cn-hangzhou.img-pub.aliyun-inc.com/8ca9f78b244c7f991e73f71fd1e56421.png)
MapReduce
基础编程模型:把一个大任务拆分成小任务,再进行汇总
• MR任务:Job = Map + Reduce
Map的输出是Reduce的输入、MR的输入和输出都是在HDFS
MapReduce数据流程分析:
• Map的输出是Reduce的输入,Reduce的输入是Map的集合
HBase
什么是BigTable?: 把所有的数据保存到一张表中,采用冗余 ---> 好处:提高效率
• 因为有了bigtable的思想:NoSQL:HBase数据库
• HBase基于Hadoop的HDFS的
• 描述HBase的表结构
核心思想是:利用空间换效率
零基础的同学学习大数据开发不能急于求成,要分阶段分步骤来一步步完成,大概可以分为四步:
第一个阶段:了解大数据的基本概念
首先,学习一门课程的时候,要对这门课程有一个简单的了解,比如说,要先学习这门课程的一些专业的术语,学习一些入门概念知道这么课程是做什么的,主要的学习知识有哪些。那么学习大数据就必须知道什么是大数据,一般大数据的运用领域是那些,避免自己在对大数据一无所知的情况下就开始盲目学习。
第二个阶段:学习计算机的编程语言
对于零基础的小伙伴们来说,开始入门可能并不是那么容易,需要学习大量的理论知识,阅读枯燥的教材。因为要掌握一门计算机编程语言,还是很难的。大家都知道计算机编程语言有很多,比如:R,C++,Python,Java等等。
第三阶段:大数据有关的学习课程
经过了前两阶段的基础学习后,我们对编程语言也基本掌握了,接下来就可以进行大数据部分的课程学习了。在这里小编要特别提醒大家:行业真正大数据,82%主讲都是hadoop、spark生态体系、storm实时开发,初学者请务必认清你要学的是不是真正大数据!
第四个阶段:项目实战阶段
实战训练可以帮助我们更好的理解所学的内容,同时对相关知识加强记忆。在以后的实际运用中,可以更快的上手,对于相关知识的使用方法也有了经验。
世上无难事只怕有心人,无论你是有基础也好还是没基础也好,只要你认真学习大数据就一定会学好。
后续提高
大数据结合人工智可以达到真正的数据科学家。
机器学习:是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。机器学习的算法基本比较固定了,学习起来相对容易。
深度学习:深度学习的概念源于人工神经网络的研究,最近几年发展迅猛。深度学习应用的实例有AlphaGo、人脸识别、图像检测等。是国内外稀缺人才,但是深度学习相对比较难,算法更新也比较快,需要跟随有经验的老师学习。
最快的学习方法,就是师从行业专家,毕竟老师有多年积累的经验,自己少走弯路达到事半功倍的效果。
网友评论