这一周几乎什么事也没有干,不断查一个服务不断崩溃的原因。
以前没有出现过,就是前几天加了一个定时任务,从数据库里捞数据然后放到内存中。这个数据是别人的,因为我要用里面的数据,他们没有时间,只好我自己来处理。这个逻辑也不复杂,就一张表,数据量也不大,接近千万级数据,但通过索引,查出来只有20多万条数据而已。
考虑到毕竟是千万级的数据,我分批查询,做了重试逻辑,做了异常保护,在测试环境连正式环境跑是没有问题,但一发到正式环境,到了定时的时间,动不动就挂了,虽然服务有重启机制和程序有重试逻辑,数据是没有问题,可是动不动挂了,让人心烦。找了几天,不断加日志,加异常保护,换了好几个方法都找不到问题,没有异常日志,没有崩溃的日志。虽然知道是定时任务的问题,可就是找不到问题的原因。
网友评论