中信5G任务阻塞上传库更新问题
时间:2024年3月18号
原因:设置字段【field_41_41】默认值
操作:
1、[endif]暂停airflow的【中信5g】的任务
2、[endif]每隔一段时间修改192.168.200.201的airflow库的dag_run数据表,将【中信5g】排队的任务状态为【queued】设置状态为【success】
update dag_runset state='succsess' wheredag_id='ods.dwh.public.dwh_zhongxin5gfenanbiaomeiridaochu_lx001506_20220428171805'
3、到晚上全量同步数据表【dwh_zhongxin5gfenanbiaomeiridaochu_lx001506_20220428171805】
4、3月19号确认是科技的问题,会发版处理
时间:2024年3月21号
原因:上传新的数据,会更新全部数据的字段值【field_41_41】
操作:
1、 暂停airflow的【中信5g】的任务
2、 每隔一段时间修改192.168.200.201的airflow库的dag_run数据表,将【中信5g】排队的任务状态为【queued】设置状态为【success】
update dag_runset state='succsess' wheredag_id='ods.dwh.public.dwh_zhongxin5gfenanbiaomeiridaochu_lx001506_20220428171805'
3、 手动触发airflow的【ods.dwn.public.dwh_operation_log】,拉取最新的日志
4、 根据日志,找出其它更新模板,一个个手动触发执行
5、每个模板执行完成后,更新dwh_operation_log中【handle_state】为1
6、2、3、4、5步骤一天不断的重复执行,一直到23点任务都没有终止,但确认过最新排队的任务pid对应的时间为12:00多
时间:2024年3月22号
1、早上5点发现任务还在增加,将【中信5g】的任务重新定义,置为空任务,但任务执行的仍然很慢
2、来到公司,才知道是dwh_operation_log通过消费binlog,于是想通过修改消费的起始时间,跳过昨天的日志
但设置之后,没过多长时间,还是自动跳回最开始消费的offset
又重复昨天的步骤,消费是有进度的,但隔一段时间就停止消费
直到12点,消费完毕,全量同步【中信5g】的数据,并比对从21号存在更新的模板,数仓和上传库的大小。
以上是处理此次问题的全部步骤,另外想说些我自己的感受。
3月18号,我一天都在医院,拿着个电脑,不停的处理问题。现在是去哪都要带着电脑,就怕出现问题。每天睁眼打开手机也是看看有没有报错消息,不管几点,都要远程处理。
3月21号,虽然【中信5g】的问题很棘手,但有个【中信回款占比】也是必须当天完成,我一边处理【中信5g】的任务,一边开发【中信回款占比】应用表。对于工作我已经尽力了。干这么年,没像现在这么挫败过。做啥都是错的。
网友评论