大数据是什么简介

作者: air_b10f | 来源:发表于2019-06-23 20:53 被阅读0次

大数据是什么简介
大数据工具Hadoop快速入门１大数据简介
中英数据库专家“达摩院论剑”：数据库的过去、未来和现在
「直播实录」中英数据库专家谈：数据库的过去、未来和现在
java大数据之greenplum
数据中台交付专家告诉你，数据架构的分层怎样更加合理
Python 操作三大主流数据库百度网盘分享
2.Logstash介绍
mysql索引
hive之路（1）

一、是什么

大数据（big data），指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

发展历程：

2008年被《自然》杂志专刊提出了BigData概念

萌芽阶段：

20世纪90年代到21世纪的样子，数据库技术成熟，数据挖掘理论成熟，也称数据挖掘阶段。

突破阶段：

2003——2006年，非结构化的数据大量出现，传统的数据库处理难以应对，也称非结构化数据阶段。

成熟阶段：

2006——2009年，谷歌公开发表两篇论文《谷歌文件系统》和《基于集群的简单数据处理:MapReduce》，其核心的技术包括分布式文件系统GFS，分布式计算系统框架MapReduce，分布式锁Chubby，及分布式数据库BigTable，这期间大数据研究的焦点是性能，云计算，大规模的数据集并行运算算法，以及开源分布式架构（Hadoop)

三篇 1、GFS：Google File System

对数据进行分布式文件系统的存储，解决的大数据的存储问题

2、MapReduce

最初是因为Google要去爬取全球的网页然后对其进行排名(PageRank)而衍生出的问题，一种用于大数据计算的模型，核心思想是大事化小处理，最后在合并结果，先拆分再合并

3、BigTable

采用NoSQL数据库将数据存在一张大表之中，通过牺牲存储的空间来换取性能

应用阶段：

2009年至今，大数据基础技术成熟之后，学术界及及企业界纷纷开始转向应用研究，2013年大数据技术开始向商业、科技、医疗、政府、教育、经济、交通、物流及社会的各个领域渗透，因此2013年也被称为大数据元年。

二、为什么

数据量大，要分析预测。