自学大数据从哪入手

作者: 烽火程序猿 | 来源:发表于2019-06-21 13:57 被阅读2次

大数据技术感觉太高深了,想要自学大数据,该从哪入手呢?

关于大数据技术要点,今日集中呈现!

首先,提及大数据一词的概念。大数据本质还在于数据,但是它有着新的特征亮点。包括:数据来源广,数据格式多样化(结构化数据、非结构化数据、Excel文件、文本文件等)、数据量大(最少也是TB级别的、甚至可能是PB级别)、数据增长速度快等等。

扩展讲大数据的4个基本特征,我们将进行下面额思考:

1.数据来源广?

广泛的数据来源从何而来,通过何种方式进行采集与汇总?相对应的我们出现Sqoop,
Cammel,Datax等工具。

2.数据采集之后,该如何存储?

采集之后,为了方便存储,我们对应的出现了GFS,HDFS,TFS等分布式文件存储系统。
并且,介于数据的增长速度非常之快,这也就要求我们,数据存储必须可以进行水平扩展。

3.数据存储之后,该如何通过运算快速转化成一致的格式,又该如何快速运算出自己想要的结果?

对此,MapReduce的分布式运算框架提出了解决方案。但是由于MapReduce需要java的编程代码较多,由此,又出现了Hive,Pig等将SQL转化成MapReduce的解析引擎;再有,因普通的MapReduce只能一批一批地批量处理数据,时间消耗过多,最终目的又要求我们输入的一条数据就能得到结果,于是又出现了Storm/JStorm这样的低时延的流式计算框架;但是如果同时需要批处理和流处理,按照如上就得搭两个集群,Hadoop集群(包括HDFS+MapReduce+Yarn)和Storm集群,不易于管理,所以出现了Spark这样的一站式的计算框架,既可以进行批处理,又可以进行流处理(实质上是微批处理)。而后Lambda架构,Kappa架构的出现,又提供了一种业务处理的通用架构。
  
  4.此外,为了提高工作效率,加快运速度,出现了一些辅助工具:
  
  Ozzie,azkaban:定时任务调度的工具。
  Hue,Zepplin:图形化任务执行管理,结果查看工具。
  Scala语言:编写Spark程序的最佳语言,当然也可以选择用Python。
  Python语言:编写一些脚本时会用到。
Allluxio,Kylin等:通过对存储的数据进行预处理,加快运算速度的工具。

以上就是大数据生态圈中能够用到的工具,大数据高端班培训拥有更加细致,完整的大数据开发知识体系,内容包含Linux&&Hadoop生态体系、大数据计算框架体系、云计算体系等等。我们只为成就非凡人生,构筑梦想桥梁,期待有兴趣的朋友加入我们

相关文章

  • 自学大数据从哪入手

    大数据技术感觉太高深了,想要自学大数据,该从哪入手呢? 关于大数据技术要点,今日集中呈现! 首先,提及大数据一词的...

  • 大数据入门系列

    没有基础想学大数据难吗? 大数据入门学习,你要掌握这些技能 大数据领域三个大的技术方向 自学大数据从哪入手 大数据...

  • 好程序员分享自学大数据从哪入手

    好程序员大数据高端班分享自学大数据从哪入手,最近一群小伙伴找到好程序员,纷纷留言,大数据技术感觉太高深了,想要自学...

  • 从哪入手

    昨天晚上在讨论时谈到了关于自卑的问题,我想,每一个人都或多或少的有一些自卑的心理,只不过是有的严重,影响到了自己的...

  • 0基础自学UI设计从哪开始入手?

    嗯,首先呢,这是我自己在学习过程中的经验的一篇文章,也是我在UI中国发表的第一篇经验文。废话不多,进入主题。 目前...

  • 从哪入手呢

    刘斌焦点网络四期驻马店坚持分享第295天 与一学生谈论起如何提高成绩。 我问:您认为要想提高数学成绩,最快的努力...

  • 敲黑板 划重点 自学大数据应从哪里入手

    大数据时代,如何把握大数据技能,自学大数据需要从哪些地方入手?好程序员今天就为大家送福利,由一线大数据培训讲师为大...

  • 如何进入大数据领域,学习路线是什么?

    如何进入大数据领域,学习路线是什么? 了解了大数据,想学习大数据,又不知道该如何入手,从哪开始学习大数据? 下面翡...

  • 税务筹划从哪入手

    现在好多企业老总和会计人员谈税色变,对于税收筹划大家都是避之不及,你真的懂税务筹划吗?每个企业都需要税务筹划。小编...

  • 从哪入手做增量?

    “增量”是最近频频听到的一个词汇。由于前三年起起伏伏的动荡,很多公司的业务都受到了损失或制约,新年开始,都想卯足劲...

网友评论

    本文标题:自学大数据从哪入手

    本文链接:https://www.haomeiwen.com/subject/mgfnfctx.html