美文网首页我爱编程
大数据基础概念

大数据基础概念

作者: 追光者_Go | 来源:发表于2018-04-11 13:29 被阅读0次

1、什么是大数据?

以Hadoop为代表的大数据平台框架上进行各种数据分析的技术。

包括了以Hadoop和Spark为代表的基础大数据框架

还包括了实时数据处理,离线数据处理;数据分析,数据挖掘和用机器算法进行预测分析等技术。

2、Hadoop是什么?

一个开源的大数据框架、一个分布式计算的解决方案

Hadoop=HDFS(分布式文件系统)+MapReduce(分布式计算)

3、Hadoop核心

HDFS分布式文件系统:存储是大数据技术的基础

MapReduce编程模型:分布式计算时大数据应用的解决方案

4、HDFS总结

普通的成百上千的机器

按TB甚至PB为单位的大量的数据

简单便捷的文件获取

5、Hadoop基础架构

HDFS概念
   数据块 : 数据块是抽象块而非整个文件作为存储单元

           默认大小为64MB,一般设置为128M,备份X3
           
NameNode : 主节点

           管理文件系统的命名空间,存放文件元数据。
           维护着文件系统的所有文件和目录,文件与数据块的映射。
           记录每个文件中各个块所在数据节点的信息 
           
DataNode : 从节点
    
           存储并检索数据块
           向Namenode更新所存储块的列表
           
HDFS 由 一个namenode  多个datanode组成

6、HDFS优点

适合大文件存储,支持TB、PB级的数据存储,并有副本策略

可以构建在廉价的机器上,并有一定的容错和恢复机制。

支持流式数据访问,一次写入,多次读取最高效。

7、HDFS缺点

不适合大量小文件存储

不适合并发写入,不支持文件随机修改
      
不支持随机读等低延时的访问方式

相关文章

  • 大数据敲门砖,想入行大数据必须学习这些知识

    基础概念 大数据的本质 一、数据的存储:分布式文件系统(分布式存储) 二、数据的计算:分部署计算 基础知识 学习大...

  • 常见的运营指标

    所谓的基础指标概念,指的是在建设基础数据指标前,作为数据运营的起点,需要了解到的一些基础概念部分——包括指标,数据...

  • 数据库基础Database1-初级SQL

    数据库基础Database1 一 基础概念 1. 概念 数据库管理系统(Database Management S...

  • 微信小程序与云开发

    微信小程序基础概念 小程序云开发的三大基础能力:云数据库、云函数、云存储 Java、NodeJS、JavaScri...

  • IOS逆向_网络分析:Charles、Wireshark

    1、基础概念; 2、Wireshark; 3、Charles; 1、基础概念; 1.1网络封包:指数据包在...

  • 数据分析

    1、数据分析概念和统计学基础。 数据分析概念,方法论,流程。 数据分析和数据挖掘的概念。商业数据分析预测的本质。 ...

  • 大数据基础概念

    1、什么是大数据? 2、Hadoop是什么? 3、Hadoop核心 4、HDFS总结 5、Hadoop基础架构 H...

  • 大数据基础概念

    传统的大数据 在大数据这个概念还没出来以前人们是怎么进行数据数据分析和计算的呢? 数据存储 首先数据量都没有很大,...

  • MySQL简单CURD操作(持续更新)

    一、基础概念 定义:数据库就是一个以某种有组织的方式存储的数据集合 数据库语言四大类 DDL(数据定义语言):用来...

  • 数据仓库模型设计

    仓库数据模型知识 数据仓库模型设计方法论 数据分类规划 数据分布调研 数据CRUD操作调研 基础概念模型 概念模型...

网友评论

    本文标题:大数据基础概念

    本文链接:https://www.haomeiwen.com/subject/qhwahftx.html