美文网首页
我的数据仓库职业之路(一)

我的数据仓库职业之路(一)

作者: 麦麦娟 | 来源:发表于2018-06-07 10:38 被阅读46次

    引言:最近领导让我做个小培训,主题是简单介绍SAPBW架构以及在企业信息化建设中起到的价值。如果你对大数据分析、数据仓库或者仅仅只对SAP BW模块感兴趣,都可以看看。

    SAP公司总部设在德国,SAP也是一套软件的名称,主要为企业管理提供解决方案,它是ERP(企业资源管理)解决方案的先驱,也是世界排名第一的ERP软件,可以为各种行业、不同规模的企业提供全面的解决方案。87%以上的世界500强公司都已在使用SAP。

    SAP系统常用的模块有FICO、SD、MM、PP、PS,以及最近几年比较风靡的大数据应用,SAP也有相应的解决方案,就是BW(Business Information Warehouse,商务信息仓库)。

    当企业上线SAP的诸如SD、MM等业务模块后,大量的数据信息库堆积成一座金矿,但是能不能挖掘到金子,并且快速,有效地,就需要强有力的工具。

    BW能抽取来源地不同的金矿,并通过清洗地方式淘到有用的数据,这些数据经过传送带传输,再经过工具整合形成报表,报表通过多维度,可视化的展示,最终为管理者的决策提供基础。

    其实BW最后展示出来的是很多的报表。起初我接触BW的时候,做的很多工作都是处理数据,分析数据,核对数据。这个过程大多数时候比较枯燥的,但看多了对数据就有感觉了。

    很多人会问,SAP的其他模块(以下统称为R/3系统)里本身就包含有报表,再弄一套报表系统意义何在。我想主要有几点区别:

    1、 报表时间:R/3系统里的报表数据是实时的,BW报表的数据一般都做不到实时,而且只有系统性能稳定良好,大部分时候并不需要实时报表数据。领导每天看一次准确的数据也就够了。

    2、 查看方式:要查看R/3系统的报表必须记住很多事务代码,一般只有培训学习过才能掌握,BW系统操作很简单,领导要看数据就跟看excel一样简单。

    3、 但是BW报表也不会替代R/3系统里的报表。因为BW系统里数据来是R/3系统,保留源报表可以方便数据核查。

    那么,数据仓库和普通的数据库有什么区别?

    数据仓库有个很官方的定义:

    数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。

    在知乎上找到一段解释:

    所谓的
    (1) 面向主题:指数据仓库中的数据是按照一定的主题域进行组织。

    (2)集成:指对原有分散的数据库数据经过系统加工, 整理得到的消除源数据中的不一致性。

    (3)相对稳定:指一旦某个数据进入数据仓库以后只需要定期的加载、刷新。

    (4)反映历史变化:指通过这些信息,对企业的发展历程和未来趋势做出定量分析预测。

    数据仓库建设是一个工程,是一个过程,而不是一种可以购买的产品。企业数据处理方式是以联机事务处理形式信息,并利用信息进行决策;在信息应用过程中管理信息。

    定义比较晦涩难懂,解释也挺难懂的。

    我的理解是:想象一下,数据库有点类似于一个平面,二维结构;而数据仓库则是立体结构,多个平面组成。想象的来源是根据后来了解多了BW里面元素的结构后得到。

    事实上在BW里面查询数据,系统后台解析成一条条sql语句,用JOIN的方式把多张表连接起来,可以想象用六个方形搭建成一个立方体,在进行查询操作时,如同把其中的某两个面本身构成的直接拉平成180°。这种技术保证了数据仓库的良好扩展性。平时接触到数据库产品有oracle、sql sever等。

    就说到这吧,如果你有兴趣,请期待下篇。

    相关文章

      网友评论

          本文标题:我的数据仓库职业之路(一)

          本文链接:https://www.haomeiwen.com/subject/dgwwsftx.html