美文网首页
大数据入门 | 二、初识hadoop

大数据入门 | 二、初识hadoop

作者: 松鼠的读书笔记 | 来源:发表于2019-01-29 22:28 被阅读49次

    网易云课堂《大数据技术原理与应用》课程Chapter 2学习笔记


    01 

    Hadoop是什么?

    Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构。它是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中。

    Hadoop的核心是分布式文件系统HDFS(Hadoop Distributed File System)和MapReduce。它被公认为行业大数据标准开源软件,在分布式环境下提供了海量数据的处理能力

    几乎所有主流厂商都围绕Hadoop提供开发工具、开源软件、商业化工具和技术服务,如谷歌、雅虎、微软、思科、淘宝等,都支持Hadoop。

    02 

    Hadoop的特性

    Hadoop是一个能够对大量数据进行分布式处理的软件框架,并且是以一种可靠、高效、可伸缩的方式进行处理的,它具有以下几个方面的特性:

    •   高可靠性

    •   高效性

    •   高可扩展性

    •   高容错性

    •   成本低

    •   运行在Linux平台上

    •   支持多种编程语言

    03

    Hadoop在企业中的应用

    Hadoop在企业中的应用框架

    04 

    Hadoop生态圈

    Hadoop生态圈 Hadoop生态圈

    相关文章

      网友评论

          本文标题:大数据入门 | 二、初识hadoop

          本文链接:https://www.haomeiwen.com/subject/ydpfsqtx.html