以前曾经经理有一些失败的经验,例如通过长期数据沉淀发现,在数据分析阶段沉淀的数据实际上没有办法支撑分析,还有就是某个项目为了一个目的进行数据建模与分析,结果经过长时间努力,数据只用了一次,然后就弃置不用了,下一次分析,又要重头开始搞数据。
为此,我觉得还是讲数据治理与数据分析作为2个单独的循环进行比较好,当然也要及时进行交互与迭代。
关于数据发布,我觉得要做到迭代模式,也就是定期向组织内部进行数据发布。包括已经可以用于查询的数据和元数据说明。
同时也要遵守小步快跑原则,做一些就发布一些。
一开始可以先将数据导入到DTS层,并且提炼一部分数据到主题数据库中,然后就可以进行 发布了。
对于第一批的数据,优先从现有清晰,明确的数据中直接获取。例如ERP中对外的数据接口,核心业务系统的中主数据。
当然,数据发布后,可以提供SQL客户端的查询,但是不提供任何数据分析工具,这个可以由另一个项目来进行迭代。
另外, 由于是迭代,数据格式如果发生变化,最好重新建立新的数据市场。
网友评论