美文网首页
关于数据中心ETL中的一些问题

关于数据中心ETL中的一些问题

作者: cnzhanhao | 来源:发表于2018-12-21 23:34 被阅读9次

    最近在做数据中心的ETL相关的工作,联想到之前工作的一些情况,整理一下。


    看起来是一件比较简单的事情,但在大数据量下(每天十来亿吧),似乎不是那么一定。
    之前做过一个数据同步平台,大致功能如下。

    • 数据同步平台
    • 数据监控平台
    • 数据矫正平台

    关于数据同步平台呢,就主要是围绕着【多机器,多线程池】去展开,能动态调整执行的机器,执行的程序,任务状况等。

    因为在大数据量下面,可能面临着各种情况,他的最终结果就体现在业务数据和数据中心的数据不一致的情况。这个时候就需要做数据监控了,下达各种监控的任务,去保证两边数据的一致性。

    在发现不一致的情况下,就需要去做矫正的事情了。大部分的失败情况就能通过程序自动矫正他里面不一致的情况。如果实在程序处理不了的,再通知人工接入。

    先这样吧,后面我补充一点技术方面的架构,能让他对实际工作指导吧。

    相关文章

      网友评论

          本文标题:关于数据中心ETL中的一些问题

          本文链接:https://www.haomeiwen.com/subject/kpjbkqtx.html