美文网首页技术分享
线上问题复盘,JVM Fast Throw 的故事

线上问题复盘,JVM Fast Throw 的故事

作者: 是龙台呀 | 来源:发表于2021-05-25 21:38 被阅读0次

文章字数 1.3k 左右,阅读时长 5 分钟

首先,这是一个 悲伤的故事,涉及到JVM 底层优化的知识点。想到第一次碰到这种问题时的懵逼,应了句老话:书到用时方恨少!

负责的消息中台在 晚上八点左右,运维群里反馈大量用户接收不到短信消息。登陆 Kibana 查找对应的 Error 日志,发现出现了 大量的下标越界异常

当时更...,线上问题得到了修复。但是,出现问题可不得找到问题的产出原因,不然下次有可能还会出现

因为在 ELK 上进行 日志分析不太方便,难以根据对应异常进行不同纬度上的统计分析,所以联系运维同学将故障产生当天的 Info、Error 日志 拉下来进行线下分析

经过日志分析得知,异常的产出有两种,一种是有堆栈信息,比如:

java.lang.ArrayIndexOutOfBoundsException: -1
... 省略堆栈信息

另外一种,就比较诡异,只有异常,没有对应的堆栈信息

java.lang.ArrayIndexOutOfBoundsException: null

第一种问题比较好定位,根据 异常堆栈信息,定位到了具体代码,直接进行了修复,难就难在第二种

其实这两个是一个异常,往后看小伙伴就明白了。后面做的所有事情,都是为了搞清楚两件事情

  • 为什么异常 message 会输出 null
  • 为什么堆栈信息没有输出打印

JVM Fast Throw

什么是 Fast Throw?

大白话一点来说,就是:当一些异常类型(空指针、下标越界、算术运算等...)在代码里的固定位置被抛出多次,虚拟机(HotSpot VM)会直接 抛出一个事先分配好、类型匹配的异常对象。此异常对象的 message 和 stack trace 都为空

看到这里相信读者朋友已经明白了为什么同一种异常,打印出来的日志却是不一样内容 了吧。就是因为某一个异常在同一个地方多次被抛出,JVM 抛出一个预分配异常,那么 message、stack trace 相当于被吞掉了

The compiler in the server VM now provides correct stack backtraces for all "cold" built-in exceptions. For performance purposes, when such an exception is thrown a few times, the method may be recompiled. After recompilation, the compiler may choose a faster tactic using preallocated exceptions that do not provide a stack trace. To disable completely the use of preallocated exceptions, use this new flag: -XX:-OmitStackTraceInFastThrow.

JDK 1.5 的发布文档介绍中描述了此情况,出现这种优化方案的原因是 为了提高性能。当同一种异常在相同的位置被抛出多次,编译器就会重新编译此方法。重编译后,编译器可能会 使用不提供堆栈跟踪的预分配异常 来选择更快的策略

如果想要关闭这种预分配异常的机制,可以使用 -XX:-OmitStackTraceInFastThrow。感兴趣的读者朋友可以看一下发布说明:https://sourl.cn/PMzVkC

另外通过 JVM 的源码得知,Fast Throw 机制目前支持五种异常情况,截图如下

模拟 Fast Throw

上面说的都是理论部分,这个章节使用代码来实战下

List<String> list = new ArrayList();
for (int j = 0; j < 10000; j++) {
    try {
        list.get(-1);
    } catch (Exception ex) {
        int length = ex.getStackTrace().length;
        System.out.println(String.format("报错异常 :: %s, 堆栈长度 :: %s", ex, length));
    }
}

上面程序跑在了 Java8 的环境中,通过运行程序结果可以看出来,Fast Throw 在 Java 8 中依然生效

如果没有特别情况,最好不要关闭此特性。因为如果并发量大的接口,因为程序的 BUG 导致大量的请求在同一代码处抛出异常,Fast Throw 机制可以节省很多性能损耗。通过单线程跑测试 Demo 得知,异常调用情况越多,性能差别越大

开启 Fast Throw 关闭 Fast Throw
10w 1004ms 3547ms
100 w 6193ms 30928ms
500w 37492ms ...

如果线上环境触发了 Fast Throw 机制,可以通过 向前追溯相同位置、相同异常的日志 来定位问题的产出原因

结言

千言万语汇成一句话就是,重构有风险,上线需谨慎

针对公共功能的重构,需要包含全量的测试用例,要将可能会出现的问题产出背景考虑到 极致,亦或者和身边同事说明需求背景,大家一起想下,可以极大程度避免极端问题的产出

必要的压力测试 是很重要的,这一点可以很好的将 流量大才能显现的问题 提前暴露出来

故障的产生带来的意义,有好有坏,坏的点大家都懂得;好的点自然是 积累了线上问题故障排查的经验,这样的话,后面公司妹子再遇到相同的问题,大喊一声:妹子,放开那 BUG,让我来!

相关文章

  • 线上问题复盘,JVM Fast Throw 的故事

    首先,这是一个 悲伤的故事,涉及到JVM 底层优化的知识点。想到第一次碰到这种问题时的懵逼,应了句老话:书到用时方...

  • 线上问题复盘,JVM Fast Throw 的故事

    文章字数 1.3k 左右,阅读时长 5 分钟 首先,这是一个 悲伤的故事,涉及到JVM 底层优化的知识点。想到第一...

  • 2019游戏项目技术复盘

    2019游戏项目技术复盘 线上问题复盘 一、外部服务不可抗拒因素(多次) 现象机房故障如风扇问题导致关机金山云故障...

  • NullPointerException异常丢失堆栈信息

    问题描述 手下一个项目,日志中存在以下没有任何堆栈信息的异常: 这是Hotspot虚拟机的fast throw机制...

  • JVM 复盘

    JVM 复盘 一 JVM内存块结构 主要是堆栈;方法区;而我们关注比较多的是堆区域,而方法区存放的信息比较少很少会...

  • 2018.06.07复盘的优劣

    复盘本身是没有问题的,而做复盘的人在做复盘的这个过程,会遇到很多的问题。人们的悲观心态影响着复盘的人,在复盘的过程...

  • 一次完整的JVM堆外内存泄漏故障排查记录

    前言 记录一次线上JVM堆外内存泄漏问题的排查过程与思路,其中夹带一些JVM内存分配机制以及常用的JVM问题排查指...

  • 复盘思维课程迭代

    今晚上线上直播复盘思维的课程。因为是线上,所以省略了游戏环节,也就是团队复盘的环节。只是讲课,中间有简单的互动,用...

  • 【复盘】黄埔睿思N0.63线上英文会议复盘

    欢迎大家对黄埔睿思N0.63线上英文会议进行复盘,复盘能让帮助我们相互看见,更好地前进。 复盘人:Flynn 【我...

  • 2020年倒计时,和你分享我复盘经验

    2019年开始参加线上的学习社群,参与社群运营开始接触复盘,到今天已经持续复盘215天。 复盘如何做呢?听过有人分...

网友评论

    本文标题:线上问题复盘,JVM Fast Throw 的故事

    本文链接:https://www.haomeiwen.com/subject/gsacsltx.html