美文网首页数据仓库
数据库 VS 数据仓库

数据库 VS 数据仓库

作者: 飞鸟不急 | 来源:发表于2019-11-15 20:45 被阅读0次

    数据库和数据仓库这几个字看起来都差不多,不就多个仓字嘛,又不是多了苍老师?


    从本质上来说,数据库和数据仓库都是数据的集合。没什么不同。

    但是它们的定位确是不一样。数据库是服务于事务处理的(OLTP),数据仓库是服务于商业数据分析的(OLAP)。

    用户在前端进行的操作,产生了事务和数据的变化,数据库要对这部分的数据进行增加、删除和修改。所以数据库的操作是相对简单的读写,只作用于相对少量的数据。由于数据库操作的主要对象的表中的事件记录,对其进行增删改,对应的行式存储就是最适合数据库的存储方式。

    基于以上特征,数据库一般采用的软件为MySQL,Oracle,SQLServer等关系型数据库进行数据存储。基于3NF原则,搭建E-R表格,结构较为复杂,存储紧致少冗余,对读和写都有优化的数据结构。

    而使用数据仓库的人主要是管理和运营人员,通过对历史数据的分析和洞察来做出相应的商业决策。所以数据仓库要求数据很全,需要把所有的数据整合到一起,从某些维度进行深入的分析。由于数据仓库主要是基于某些维度对大量的数据进行查询,那么列式存储最能提高查询效率。

    基于以上特征,数据仓库一般采用Hive,Greenplum,AWS Redshift等分布式数据库。在搭建数据仓库时则根据星型模型或雪花模型创建事实表和维度表。基于事实表和维度表查出面向各个业务主题的数据,然后可视化地展现出来。因此数据仓库的表结构相对简单,存储松散多冗余,一般只对读取做优化。

    数据库和数据仓库对比

    相关文章

      网友评论

        本文标题:数据库 VS 数据仓库

        本文链接:https://www.haomeiwen.com/subject/dibsictx.html