《设计数据密集型应用》第三章(3) OLTP与OLAP

《设计数据密集型应用》第三章(3) OLTP与OLAP

作者: MeazZa | 来源:发表于2019-01-22 17:38 被阅读0次

《设计数据密集型应用》第三章(3) OLTP与OLAP
OLTP与OLAP的介绍
数据库中OLAP、OLTP的差别及各自的优化方法
MPP数据库简介
数据分析之ClickHouse
数据存储--OLTP与OLAP
(3)OLTP/OLAP
OLAP、OLTP的介绍和比较
OLTP与OLAP
OLTP与OLAP

前面我们介绍了数据库的存储和提取这两个话题，介绍了LSM-tree和B-tree这两个最普遍使用的数据索引模型，这一节我们来讲讲数据库领域的两大场景：OLTP和OLAP。

什么是OLTP和OLAP

OLTP：Online transaction processing，将网页或者应用的每个操作记录，都原原本本的记录在数据库中。
OLAP：Online analytic processing，通过一些特定的查询，解决分析师在商业角度提出的一些问题。

下面的表达从多个维度进行了比较：

属性	OLTP	OLAP
读取模式	每次按照key查询少量的记录	大量记录的聚合查询
写入模式	随机访问，低延迟的写操作	批量或者流式写入
应用场景	网络应用的终端操作	内部分析用于支持决策
数据含义	数据的最新状态	发生过的历史事件
数据集大小	GB-TB级	TB-PB级

数据仓库

数据仓库，往往是从OLTP出现，经过ETL的过程，处理成对分析友好的数据结构。数据仓库在大型公司是一个很普遍的存在，但在小公司中，数据仓库和OLTP数据库可能并没有划分，因此OLTP数据库也同样支持SQL查询，但对大公司来说，处理能力就不足了。

ETL和数据仓库

前面我们讲过的索引方式，基本都是针对OLTP的，对数据仓库中的一些问题就不能很好的回答了。

分析模型：星型和雪花模型

星型模型

数据仓库中的表分为事实表和维度表，事实表中记录了所有发生的事件，维度表中是维度的信息，它们可以通过关联的方式进行查询。

星型模型

事实表中的一些列，可以视为外键引用到维度表中的其他列，来表示某一行记录的更多维度。

雪花模型

将星型模型的中的维度表，拆分为更细的子维度表，比如将product中的brand和category作成单独的维度表，这样在使用product和brand和category属性时，需要关联两个维度表。这种结构使用起来没有星型模型方便，所以数据仓库一般用的是星型模型。

列式存储

相比较把一行存储在一起的行式存储，列式存储将多行数据的相同列存储在一起，这样每个查询只需要读取和解析使用到的列就可以了。存储的格式如下所示：

列式存储

采用列式存储的方式，可以提高数据压缩的效率。采用bitmap的方式进行编码压缩，并且支持压缩后的与或操作。

一列的bitmap压缩存储

列存储的排序会提高数据的压缩程度，其中第一个排序的key的压缩程度最高，然后是第二个，以此类推。

聚合：数据Cube和物化视图

将数据中的一部分列取出，做单独的数据Cube，并存储在数据库中作为物化视图，可以大幅提高数据的查询性能，示意图如下：

两个维度的数据Cube

第三章总结

看完了这三篇文章，你应该掌握的是：

什么是OLTP和OLAP？分别的应用场景是什么？
对于OLTP，什么是日志结构存储，SSTable，LSM-trees是什么？B-tree的结构式怎么样的？
作为开发者，如果根据应用场景判断哪种工具最适合你的系统？

相关文章

《设计数据密集型应用》第三章(3) OLTP与OLAP
前面我们介绍了数据库的存储和提取这两个话题，介绍了LSM-tree和B-tree这两个最普遍使用的数据索引模型，这...
OLTP与OLAP的介绍
OLTP与OLAP的介绍数据处理大致可以分成两大类：联机事务处理OLTP（on-line transaction...
数据库中OLAP、OLTP的差别及各自的优化方法
OLTP与OLAP的介绍数据处理大致可以分成两大类：联机事务处理OLTP（on-line transaction...
MPP数据库简介
一、OLTP与OLAP区别 OLTP(OnLine Transaction Processing ，联机事务处理)...
数据分析之ClickHouse
一、OLTP与OLAP的介绍数据处理大致可以分成两大类：联机事务处理OLTP（on-line transacti...
数据存储--OLTP与OLAP
最初，数据库管理系统是为了应对商务交易的数据存储而诞生的。后来发展到各个方面的应用场景，虽然实际的应用场景不尽相同...
(3)OLTP/OLAP
先进行一下名词解释。 OLTP(On-Line Transaction Processing)：联机事务处理过程，...
OLAP、OLTP的介绍和比较
1. OLTP与OLAP的介绍数据处理大致可以分成两大类：联机事务处理OLTP(On-Line Transac...
OLTP与OLAP
1.OLTP与OLAP的基本概念与主要区别 1.1 OLTP是什么 OLTP的全称是On-line Transac...
OLTP与OLAP
数据处理大致可以分成两大类：联机事务处理OLTP（on-line transaction processing）、...

网友评论

设计数据密集型应用

本文标题：《设计数据密集型应用》第三章(3) OLTP与OLAP

本文链接：https://www.haomeiwen.com/subject/abhrjqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

设计数据密集型应用

热点阅读

设计数据密集型应用

关于我们|服务条款|联系我们|《设计数据密集型应用》第三章(3) OLTP与OLAP|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！