一、需求
1、对于所有任务产生的实时数据,通过Kafka及时推送。
2、对于新加任务需要去历史全量数据表中获取该任务已有的历史数据。
3、爬虫集群在生产数据时需要去全量数据中进行下匹配,如果不存在才会推送给Kafka。
二、架构设计图
Kafka+MySQL架构设计三、结语
欢迎相关人员一起交流。
1、对于所有任务产生的实时数据,通过Kafka及时推送。
2、对于新加任务需要去历史全量数据表中获取该任务已有的历史数据。
3、爬虫集群在生产数据时需要去全量数据中进行下匹配,如果不存在才会推送给Kafka。
欢迎相关人员一起交流。
本文标题:爬虫架构|利用Kafka处理数据推送问题(3)架构图
本文链接:https://www.haomeiwen.com/subject/wyrjlftx.html
网友评论