一次大面积线上cpu使用率过载报警总结

一次大面积线上cpu使用率过载报警总结

作者: 新栋BOOK | 来源:发表于2017-07-19 15:35 被阅读347次

一次大面积线上cpu使用率过载报警总结
Java线上服务CPU过载问题快速定位
线上环境CPU使用飙升
线上cpu过载问题
jstack 与 jmap 线上实战
"服务不可用"怎么排查？讲了100遍还是记不住？
服务不可用排查方法
性能监控、耗电优化
性能监控：Xcode 自带 Instruments工具
一个cpu占用率高的小问题

线上报警，持续收到cpu使用过载，打开cap系统（京东自研服务器监控）查看，cpu使用情况，如图：已经接近100%

cpu监控

开始处理问题：步骤如下

登入堡垒机

第一步，使用top命令

执行top命令，如图示：找到java进程

top执行结果

执行 top –p 138209 –H，找出%cpu值很大的，那个情况下一般都比其它线程超过很多，比如下面的32%，然后拿到第一列的线程ID，比如 48409这个PID。进一步将这个值转化成十六进制。printf 0x%x 48409 在一个linux系统下执行这个即可输出十六进制的数值。当然也可以使用计算器，哈哈。

第二步，打出jstack 文件（这个要快，尽可能跟top命令执行的同时进行）

执行命令 jstack 即可，后面不要跟任何参数，常见的后面经常跟的参数比如 jstack –F –l，在这里都不用。执行一个不带任何参数的jstack。将这个jstack文件通过文本编辑器打开如下：然后通过刚才第一步中转换的十六进制数值，在这个文件里面搜索，当时搜索到的一个线程是正在处理GC，而且当时

几个cpu使用率在30%以上的都是在做GC任务。

第三步，打出内存的dump文件

执行命令，jmap -dump:format=b,file=/export/Logs/anycall.jd.local/HeapDump.bin；拿到这个dump文件后，通过MemoryAnalyzer.exe工具将其打开。

说明一点，这个工具默认打开的文件大小为512M，如果dump文件过大，需要修改这个值，找到安装目录下的这个文件MemoryAnalyzer.ini，修改，如下图：

mat分析结果1

打开dump文件的图示如下：可以看到有个对象，占据了92%的大小，

mat分析结果2

进入，Dominnator Tree视图，可以发现那个线程占据的内存对象最大，如图示：有一个大量的VO对象。

mat分析结果3

点击 See stacktrace后，进入线程栈的视图，如图：已经说明了那个类，那个文件持续的加载了这个文件。

mat分析结果4

到了这里定位到了问题出现的范围，实际上也告诉你哪些逻辑上出了了问题，那么具体的哪段代码导致的还要根据这个范围和提示继续分析。

回归代码

这两次出的问题，一次是因为全量查表，一次是因为递归查es。

使用动态sql的时候，如图：如果组合条件都为空，而且你有没有防卫性的校验判断，就会导致全量查表，这是一种情况。

使用递归，而且递归跳出条件又没有处理，相当于写了个死循环，持续扫描es，加载到内存中，这是一种情况。

大量创建新对象，大量GC线程在跑。

最后定位问题，修改，上线，解决cpu使用率过高的问题。

转载请注明出处，并附上链接，尊重创作。

最好的喜欢方式是点击关注

相关文章

一次大面积线上cpu使用率过载报警总结
线上报警，持续收到cpu使用过载，打开cap系统（京东自研服务器监控）查看，cpu使用情况，如图：已经接近100%...
Java线上服务CPU过载问题快速定位
概述本文介绍一次解决线上服务Java进程CPU过载问题的经过，提供了如果定位是哪个服务进程导致CPU过载，哪个线...
线上环境CPU使用飙升
故事开始：线上部署服务3个小时后，收到服务器报警，CPU使用率达到90%。问题定位:登录线上服务器后1.使用top...
线上cpu过载问题
线上性能调优：问题：某个接口A，查询要很慢，但没有报错。那要怎么去分析问题到底在哪里呢？ top指令，首先看看c...
jstack 与 jmap 线上实战
下面是线上机器的cpu使用率，可以看到从4月8日开始，随着时间cpu使用率在逐步增高，最终使用率达到100%导致线...
"服务不可用"怎么排查？讲了100遍还是记不住？
下面是线上机器的cpu使用率，可以看到从4月8日开始，随着时间cpu使用率在逐步增高，最终使用率达到100%导致线...
服务不可用排查方法
一、发现问题下面是线上机器的cpu使用率，可以看到从4月8日开始，随着时间cpu使用率在逐步增高，最终使用率达到...
性能监控、耗电优化
线上性能监控，主要集中在 CPU 使用率、帧率和内存这三个方面。 CPU使用率 App 作为进程运行起来后会有多个...
性能监控：Xcode 自带 Instruments工具
目录 1、Instruments功能2、线上性能监控 2-1、CPU 使用率的线上监控方法 ...
一个cpu占用率高的小问题
早上醒来便被系统报警短信施加了不小的压力，系统夜间多次报警，cpu使用率过高（超过90%），昨天晚上确实是上...

网友评论

程序员

本文标题：一次大面积线上cpu使用率过载报警总结

本文链接：https://www.haomeiwen.com/subject/clvlkxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

程序员

关于我们|服务条款|联系我们|一次大面积线上cpu使用率过载报警总结|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！