美文网首页自己喜欢的技术文大数据 爬虫Python AI Sql@IT·互联网
爬虫架构|利用Kafka处理数据推送问题(3)架构图

爬虫架构|利用Kafka处理数据推送问题(3)架构图

作者: 小怪聊职场 | 来源:发表于2018-04-26 06:51 被阅读285次

    一、需求

    1、对于所有任务产生的实时数据,通过Kafka及时推送。
    2、对于新加任务需要去历史全量数据表中获取该任务已有的历史数据。
    3、爬虫集群在生产数据时需要去全量数据中进行下匹配,如果不存在才会推送给Kafka。

    二、架构设计图

    Kafka+MySQL架构设计

    三、结语

    欢迎相关人员一起交流。

    相关文章

      网友评论

        本文标题:爬虫架构|利用Kafka处理数据推送问题(3)架构图

        本文链接:https://www.haomeiwen.com/subject/wyrjlftx.html