美文网首页大数据开发
大数据分布式系统到底有哪些

大数据分布式系统到底有哪些

作者: 成都加米谷大数据 | 来源:发表于2021-02-22 18:20 被阅读0次

提到大数据,分布式是反复被提及的重要思想,大规模的数据处理,采用分布式系统是相对来说成本更低且更易实现的方式。今天的大数据开发分享,我们就主要来讲讲,大数据分布式系统到底有哪些?

通常来说,提到分布式系统,大致可以为分布式计算系统和分布式文件系统,而在分布式计算系统和分布式文件系统当中,又有具体的框架产品。

一、分布式计算系统

1.Hadoop:MapReduce

定义:一种大数据编程模型,将数据处理运用Map和Reduce的概念进行分而治之的处理。

理念:分而治之,将大任务划分为小任务。

应用场景:批处理(一次性处理数据)

2.Spark

定义:基于内存优化的分布式大数据计算框架。

理念:分而治之,将大任务划分成小任务,引入RDD概念。

应用场景:批处理(效率最好)+流处理(微小批处理)。

3.Flink

定义:分布式大数据处理框架,对流数据可以进行计算。

理念:实时处理。

应用场景:流处理。

4.分布式消息队列系统

Kafka:分布式消息队列。具有高性能,持久化,多副本备份,横向扩展能力。生产者往队列里写消息,消费者从队列中取消息进行业务逻辑。

5.分布式机器学习系统

Spark机器学习(Spark ML)

定义:以Spark为计算引擎的分布式机器学习框架。

特点:提供分布式的模型训练环境;训练数据集分布式处理的环境。

常见的机器学习框架:sklearn、Tensorflow、Pytorch。

二、分布式文件系统

文件系统是一种存储和组织计算机数据的方法,利用抽象的文件和目录代替了电脑硬盘或者光盘使用数据块的概念。

文件系统将硬盘以块为单位进行划分,每个文件都占据若干块。然后再通过一个文件控制块(File Control Block)记录每个文件占据的硬盘数据块。

分布式文件系统是将文件存储在不同的服务器上面。用户不能直接访问,而是通过网络,利用特定的通信协议和文件服务器进行沟通。

市场上典型的分布式文件系统,以Hadoop的HDFS受到主流青睐,基于Hadoop生态圈,可以与诸多技术框架集成,性能表现优秀。

除此之外,也有一些其他的分布式文件系统,如:GFS 、TFS等。

关于大数据开发,大数据分布式系统到底有哪些,以上就为大家做了简单的介绍了。做大数据开发,对于分布式系统的掌握是必备的基础,从理论到技术框架都要投入相当的精力才行。

相关文章

  • 大数据分布式系统到底有哪些

    提到大数据,分布式是反复被提及的重要思想,大规模的数据处理,采用分布式系统是相对来说成本更低且更易实现的方式。今天...

  • 分布式基础-负载均衡

    前言 我理解只所以要分布式系统,无非两个原因数据和计算,单机系统无法保存这么大的数据量,所以要分布式系统来保存; ...

  • 大数据敲门砖,想入行大数据必须学习这些知识

    基础概念 大数据的本质 一、数据的存储:分布式文件系统(分布式存储) 二、数据的计算:分部署计算 基础知识 学习大...

  • 大数据

    一、大数据的特点 数据量大;数据生成快;数据形式多样;数据价值大。 二、HDFS hadoop分布式文件系统。 特...

  • 分布式中的log

    log在当前互联网中的应用: 分布式数据系统中有序的数据变化,数据分布式化 消息系统----消息系统是事件驱动架构...

  • (1)分布式ID之为什么需要分布式ID以及分布式ID的业务需求

    分布式id主要用到哪些地方 在复杂分布式系统中,往往需要对大量的数据和消息进行唯一标识。如在美团点评的金融、支付、...

  • spark数据倾斜以及解决方案

    对 Spark/Hadoop 这样的分布式大数据系统来讲,数据量大并不可怕,可怕的是数据倾斜。 对于分布式系统而言...

  • Spring分布式事务实现概览

    分布式事务,一直是实现分布式系统过程中最大的挑战。在只有单个数据源的单服务系统当中,只要这个数据源支持事务,例如大...

  • 《分布式技术原理与算法解析》学习笔记Day21

    分布式数据存储三要素 什么是分布式数据存储系统? 分布式存储系统的核心逻辑,就是将用户需要存储的数据根据某种规则存...

  • NOSql_Hbase简介

    Google发布大数据三大论文:GFS文件系统、MapReduce分布式计算框架及BigTable大表。 GFS-...

网友评论

    本文标题:大数据分布式系统到底有哪些

    本文链接:https://www.haomeiwen.com/subject/pkukfltx.html