大数据简述

大数据简述

作者: do_young | 来源:发表于2019-11-13 10:46 被阅读0次

json数据简述
大数据简述
数据分片简述
JavaScript数据结构和算法简述——数组
大数据可视化大屏设计经验分享
从数据分析、交互设计的角度看数据分析类saas产品
oneDay
RxJava2 源码解析（一）
iOS 之 FMDB、CoreData、Plist、NSUse
数据库简述

分布式文件系统

GFS

分布式计算

MapReduce
Yarn
在Hadoop早期，MapReduce既是一个执行引擎，又是一个资源调度框架，服务器集群的资源调度管理由MapReduce自己完成。但是这样不利于资源复用，也使得MapReduce非常臃肿。于是一个新项目启动了，将MapReduce执行引擎和资源调度分离开来，这就是Yarn。2012年，Yarn成为一个独立的项目开始运营，随后被各类大数据产品支持，成为大数据平台上最主流的资源调度系统。
Pig
Pig是一种脚本语言，使用类SQL的语法，开发者可以用Pig脚本描述要对大数据集上进行的操作，Pig经过编译后会生成MapReduce程序，然后在Hadoop上运行
Hive
Hive支持使用SQL语法来进行大数据计算，比如说你可以写个Select语句进行数据查询，然后Hive会把SQL语句转化成MapReduce的计算程序。
这样，熟悉数据库的数据分析师和工程师便可以无门槛地使用大数据进行数据分析和处理了。Hive出现后极大程度地降低了Hadoop的使用难度，迅速得到开发者和企业的追捧。据说，2011年的时候，Facebook大数据平台上运行的作业90%都来源于Hive。

分布式数据库

HBase
是从Hadoop中分离出来的、基于HDFS的NoSQL系统。
Cassandra

大数据

Sqoop
专门将关系数据库中的数据导入导出到Hadoop平台
Flume
针对大规模日志进行分布式收集、聚合和传输
Oozie
MapReduce工作流调度引擎

大数据离线计算

Spark
当时AMP实验室的马铁博士发现使用MapReduce进行机器学习计算的时候性能非常差，因为机器学习算法通常需要进行很多次的迭代计算，而MapReduce每执行一次Map和Reduce计算都需要重新启动一次作业，带来大量的无谓消耗。还有一点就是MapReduce主要使用磁盘作为存储介质，而2012年的时候，内存已经突破容量和成本限制，成为数据运行过程中主要的存储介质。Spark一经推出，立即受到业界的追捧，并逐步替代MapReduce在企业应用中的地位。

大数据流式计算

Storm、Flink、Spark Streaming
流式计算要处理的数据是实时在线产生的数据，所以这类计算也被称为大数据实时计算。

机器学习

TensorFlow、Mahout以及MLlib
内置了主要的机器学习和数据挖掘算法。

大数据要存入分布式文件系统（HDFS），要有序调度MapReduce和Spark作业执行，并能把执行结果写入到各个应用系统的数据库中，还需要有一个大数据平台整合所有这些大数据组件和企业应用系统

image

相关文章

json数据简述
json数据 Json是互联网上结构化数据的传输标准；javascript，php等语言对其支持度都很好。 Jso...
大数据简述
分布式文件系统 GFS 分布式计算 MapReduce Yarn在Hadoop早期，MapReduce既是一个执行...
数据分片简述
一简述传统的关系型数据库，比如常用的 MySQL 都存在性能瓶颈，即在数据达到一定的量级之后，数据库的性能会显...
JavaScript数据结构和算法简述——数组
JavaScript数据结构和算法简述——数组
大数据可视化大屏设计经验分享
欢迎来到BigData的世界现如今，我们来到了数据时代，数据信息化与我们的生活与工作息息相关。此篇文章简述利用大...
从数据分析、交互设计的角度看数据分析类saas产品
目录简述 Saas产品-神策数据数据分析工作流目标用户交互设计总结投融资历程百度指数最后简述 ...
oneDay
大鲸鱼的简述书 oneDay
RxJava2 源码解析（一）
简述：本篇主要分析 Observable、Observer 产生(create)、关联(subscribe)、数据...
iOS 之 FMDB、CoreData、Plist、NSUse
简述数据储存可以分为数据结构和储存方式。数据结构就是数据存在的的形式。例如 NSDictionnary、NSAr...
数据库简述
数据库数据库是按照规定的数据格式组织、存储和管理数据的仓库，只不过这个仓库是在计算机存储设备上的。二维表关系...

网友评论

本文标题：大数据简述

本文链接：https://www.haomeiwen.com/subject/xyfcuctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|大数据简述|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！