本文旨在为普通程序员(Java程序员最佳)提供一个入门级别的大数据技术学习路径,不适用于大数据工程师的进阶学习,也不适用于零编程基础的同学。因为大数据涉及的技术很广需要了解的东西也很多,会让很多新手望而却步
大数据方向的工作目前分为三个主要方向:
01.大数据工程师
02.数据分析师
03.大数据科学家
04.其他(数据挖掘本质算是机器学习,不过和数据相关,也可以理解为大数据的一个方向吧)
大数据工程师的技能要求
附上比较权威的大数据工程师技能图
完整高清图在文末获取
通过总结学习大数据需要掌握如下:
必须技能10条
Java高级(虚拟机、并发)
Linux 基本操作
Hadoop(此处为侠义概念单指HDFS+MapReduce+Yarn )
HBase(JavaAPI操作+Phoenix )
Hive(Hql基本操作和原理理解)
Kafka
Storm
Scala需要
Python
Spark (Core+sparksql+Spark streaming )
高阶技能6条
机器学习算法以及mahout库加MLlib
R语言
Lambda 架构
Kappa架构
Kylin
Aluxio
二、学习路线
完整高清图文末获取
第一阶段(基础阶段)
1.Linux学习
2.Java 高级学习《深入理解Java虚拟机》、《Java高并发实战》
3Zookeeper学习
第二阶段(攻坚阶段)
Hadoop 《Hadoop 权威指南》
Hive《Hive开发指南》
HBase 《 HBase权威指南》
Scala《快学Scala》
Spark 《Spark 快速大数据分析》
Python
第三阶段(辅助工具工学习阶段)
Sqoop
Flume
Oozie
Hue
那如何学习才能快速入门并精通呢?
当真正开始学习的时候难免不知道从哪入手,导致效率低下影响继续学习的信心。
但最重要的是不知道哪些技术需要重点掌握,学习时频繁踩坑,最终浪费大量时间,所以有一套实用的视频课程用来跟着学习是非常有必要的。
为了让学习变得轻松、高效,今天给大家免费分享一套陆金所的大数据架构师传授的一套教学资源。帮助大家在学习大数据的道路上披荆斩棘。
这套视频课程,详细讲解了Hadoop生态(MR、Hbase、Spark、Storm等)开发技术,深度讲解了数据挖掘、机器学习相关的算法、神经网络等内容!
而且还把集群需要用到的各种程序进行了打包,根据基础视频可以让你轻松搭建Hadoop完全分布式环境,像在企业生产环境一样进行学习和实践。
获取方式
关注“大数据钻研”公众号 回复“大数据”
再次强调:
1、把数据分析作为一种能力培养,让自己在现在的团队中展现出良好的数据分析能力,为你以后内部转岗做好准备。当然如果你觉得自己看书效率太慢,根据自己情况决定。如果看书效率不高就选网课,相反的话就自己看书。
2、扎实学好一、两门数据挖掘软件,基于你已有得编程基础,可以学SAS或者R,基本能够满足很大部分企业的需求。
3、多看多想多观察,学习业务职能是这样,细水长流,还需要不断工作积累和广泛的阅读。
最后,希望你能够成为你想成为的人!
网友评论