美文网首页
OOM问题分析定位

OOM问题分析定位

作者: Davie彪 | 来源:发表于2020-02-21 17:20 被阅读0次

    一 、问题描述

          直接上图,这个是之前在测试环境上发现的问题,导致整个服务崩了。(心里暗喜,幸亏是测试环境啊,上线那不得...)从打印的日志可以很清楚的知道啥原因,OOM嘛

    java堆内存溢出原因:内存泄漏或者堆的大小设置不当引起的。对于内存泄露,需要通过内存监控软件查找程序中的泄露代码,而堆大小可以通过虚拟机参数-Xms,-Xmx等修改。

        问题分析:

        (1)这个服务在测试环境跑了这么久,都没出现这种情况,应该可以排除堆的大小设置不当的原因(正常操作应该是查看堆大小的设置情况进行排查问题,当时抖机灵了hhhh)

        (2)在5分钟前,我刚刚发了一个版本到测试环境,就出现这问题,感觉大概率是代码问题

         话不多说,赶紧分析一波代码。但是,为了假装自己是一个比较在行的程序员,还是按流程办事吧,先搞个dump文件,分析是哪里出现问题了。

    二、MAT(Memory Analyzer Tool)分析

    1.下载地址

    https://www.eclipse.org/mat/downloads.php

    2.获取dump文件

        登录服务器,进入到bin目录下,用java自带的jmap命令生成dump文件,命令如下:

          ./jmap -dump:format=b,file=/home/xxxxx/heap.hprof pid(进程id)

    3.Leak Suspect报告

           从报告中,可以清楚的看到   io/vertx/core/impl/TaskQueue 这个类中的一个属性 java/util/LinkedList 类型的,占用了60.83%内存,往上看,这个还是跟kafka消费有点关系。

    4.Chart报告

          这个图也可以清晰的看到,java/util/LinkedList这个类型占用了较高的内存,那这个肯定是问题的隐患所在嘛。

    三、代码问题

         1.代码逻辑很简单,当有消息写入的时候,则利用vertx框架的异步操作处理逻辑。

    vertx.executeBlocking(future->{/**

        * 业务代码逻辑

        */},null);

       2.查看这个异步操作的执行过程

    (1)VertxInternal 接口  Vertx 接口;VertxImpl 类 实现了 VertxInternal 接口,并重写了 executeBlocking方法

    (2)executeBlocking方法分析

         两个接口的区别之处在于,多了个order参数(是否有序),我的代码是调用了下面的接口,默认是有序执行。我们在仔细的品一品上面这个方法的实现。ContextImpl 、ContextImpl、ContextImpl 这个类不就是打印的日志中报oom的类嘛是,说明距离真相已经很近了。

        我们在仔细的看一下这个方法的具体实现,里面有这么一段代码。这个queue就是我们之前报告分析中的TaskQueue。当我们设置了order=true的时候,会创建一个TaskQueue,用于按序存放要执行的任务;同时,由于是按序执行任务,vertx框架只会创建一个工作线程来处理业务逻辑,用于保证有序执行任务。在测试环境只有一台机器,也就是只有一个消费者,而我们的生产者大概是一分钟产生2w条数据,导致TaskQueue中的 tasks 添加了较多的任务而出现OOM。

     private final LinkedList<Task> tasks = new LinkedList<>();

    ContextImpl 类中的executeBlocking方法

      if (queue != null) {

            queue.execute(command, exec);

          } else {

            exec.execute(command);

          }

    TaskQueue类中的execute方法

    public void execute(Runnable task, Executor executor) {

        synchronized (tasks) {

          tasks.add(new Task(task, executor));

          if (current == null) {

            current = executor;

            executor.execute(runner);

          }

        }

      }

    四、问题解决

     (1)将执行异步操作的过程设置会无序的,这样的话vertx框架会创建一个线程池,用于执行任务

     (2)自己创建一个固定大小的线程池用于执行任务,类似方案(1)

    相关文章

      网友评论

          本文标题:OOM问题分析定位

          本文链接:https://www.haomeiwen.com/subject/otbadqtx.html