LTC(Lead To Cash)的DAG。出席到签单的事实数据处理。
该DAG每天每天运行一次。先处理存量数据,然后处理增量数据。
对于存量数据:
如果业务逻辑没有变化,实际上只需要运行一次,运行前检查该dag当前所处理的master的binlog位置,如果不存在则要运行该task,成功后记录binlog位置信息。
如果存量数据都来自镜像数据库,该binlog位置信息并不在镜像数据库中,而在用于恢复成镜像数据库的线上全量备份中。
对于增量数据:
每次都需要运行,在存量处理成功后运行。运行时,从上次的成功标识位置开始,到当前运行时间,约等于airflow的next_execution_date为止,成功后记录位置信息。
如果需要重新生成事实数据,则可以清除位置标识,重新生成事实数据,
网友评论