最近找工作开始发现了很多数据产品的岗位,薪资待遇也还不错。在互联网行业混迹了这么多年,大数据之前也接触过。看到些新的概念词,如:数据仓库
数据BI等不是很理解 就去百度了下:
一、数据仓库是什么
可以理解为:面向分析的存储系统。
也就是说数仓是存数据的,企业的各种数据往里面塞,主要目的是为了有效分析数据,后续会基于它产出供分析挖掘的数据,或者数据应用需要的数据,如企业的分析性报告和各类报表,为企业的决策提供支持。
上面的意思先理解着,接下来从头讲起,先看关系型数据库,它可以被划分为两大基本类型:操作型数据库和分析型数据库。
1. 操作型数据库
主要面向应用,用于业务支撑,支持对实际业务的处理,也可以叫业务型数据库。
可以理解为通常意义上的数据库(后端开发同学口中的经常提到的就是这种)。
2. 分析型数据库
主要面向数据分析,侧重决策支持,作为公司的单独数据存储,负责利用历史数据对公司各主题域进行统计分析。
由于分析型数据库中的操作都是查询,因此也就不需要严格满足关系型数据库一些设计规范,这样的情况下再将它归为数据库不太合适,也容易不引起混淆,所以称之为数据仓库。
这里可以说一下,数据处理大致可以分成两大类:OLTP(联机事务处理)和OLAP(联机分析处理)。
OLTP(联机事务处理)就是操作型数据库的主要应用,更侧重于基本的、日常的事务处理,包括数据的增删改查。
OLAP(联机分析处理)就是分析型数据库的主要应用,以多维度的方式分析数据, 这个后续会整理。
二、数据仓库有什么特点
相对于数据库,数据仓库有以下特点
(1)面向主题
数据仓库通过一个个主题域将多个业务系统的数据加载到一起,为了各个主题(如:用户、订单、商品等)进行分析而建,操作型数据库是为了支撑各种业务而建立。
(2)集成性
数据仓库会将不同源数据库中的数据汇总到一起。
(3)历史性
较之操作型数据库,数据仓库的数据是为企业数据分析而建立,所以数据被加载后一般情况下将被长期保留,前者通常保存几个月,后者可能几年甚至几十年。
(4)时变性
是指数据仓库包含来自其时间范围不同时间段的数据快照,有了这些数据快照以后,用户便可将其汇总,生成各历史阶段的数据分析报告。
(5)稳定性
数据仓库中的数据一般仅执行查询操作,很少会有删除和更新。但是需定期加载和刷新数据。
这一些新的理论形成 对于没有接触过的确实难以理解,幸好小编做过一下数据分析,所以通俗的理解了下,大概如下三点:
1.数据库仓库,其实就是个抽象的概念,数据仓库的数据就是来自于业务数据库(就是我们开发哥哥往里面去增删改查的数据库)将业务数据库的数据经过清洗,也就是筛选后放入到数据库仓库里
2.对数据仓库的数据进行挖掘,即形成数据报表,数据分析,多个维度分析用户的属性和行为
3.通过这些数据来做出决策和运营手段
www.mmdyin.com
网友评论