美文网首页JAVA运维日常运维行业的易筋经
运维常见错误及问题定位分析

运维常见错误及问题定位分析

作者: CasonHong97 | 来源:发表于2020-02-06 13:35 被阅读0次

1、日常监控工作中,最常出现的故障或异常有:


请求超时、应用假死、数据库超时

磁盘空间不足

unavailable by ICMP,IP不通

内存故障,负载高

监控图形有断图情况


2、以上故障或异常会出现的原因:


超时排查网络,看看有没网络异常

具体排查特定的应用有没异常,如假死,数据库超时等

日志等写满了,未及时清理

网络故障或机器宕机。

内存有问题、内存槽有问题,内存是否有泄露的情况

检查是否有异常进程占用CPU或磁盘IO过慢的情况


3、针对以上的故障或异常,是如何解决的? 补充:如何判断故障是系统问题还是硬件问题

使用ping,route,ss,nslookup,tcpdump分析网络网络状态,分析网络故障

使用ls,df,find,lsof等工具可以查找占用磁盘的答文件,分析文件过大的原因

使用特定的命令对特定的服务进行故障分析,如使用curl分析Web服务器故障

使用ps,top等命令分析进程,杀死异常进程

分析是否监控服务器的数据量,可以考虑使用主动监控或分布式监控解决


相关文章

  • 运维常见错误及问题定位分析

    1、日常监控工作中,最常出现的故障或异常有: 请求超时、应用假死、数据库超时 磁盘空间不足 unavailable...

  • 认识运维工作不能犯的8个错误

    错误1:运维是运维人的运维 这个是必须首先要纠正的,因为它关系到你的定位和团队未来的发展。当你把运维限制在运维人的...

  • 优云Monitor:开启数据中心主机运维的上帝视角

    常常有这么一句话在激励每一位运维人员,“不以故障多为耻,而以恢复快为荣。”运维人员就是要快速定位问题,分析问题,排...

  • 2018-11-23

    运维相关思想及概念 一、运维概念(一) 运维是一个非常广泛的定义,在不同的公司不同的阶段有着不同的职责与定位,如果...

  • 浅析IT运维

    运维是什么 简单的讲就是确保信息系统安全、高效、平稳的运作。 运维中一些常见问题 重建设轻运维 首先是重建设轻运维...

  • 轻量级日志收集工具Filebeat

    引言 日志对于程序非常重要,日志对于定位问题,数据分析有着十分强大的作用,是程序员和运维人员重要的工具。线上90%...

  • 高端java架构师SpringBoot ELK 分布式数据分析项

    SpringBoot ELK 分布式数据分析项目可以帮助运维及研发快速理解 elasticsearch、logst...

  • 日志平台的一点思考

    我对日志平台的理解 日志平台的对开发、运维人员的帮助是非常大的,它可以方便开发、运维人员快速定位问题,从这个角度,...

  • 2019-07-06【运维工程师培训】谈谈运维现状与前景

    运维岗位不像其它岗位,如研发工程师、测试工程师等,有非常明确的职责定位及职业规划,比较有职业认同感与成就感;而运维...

  • 运维分析问题思路总结

    方法论:思考的深度决定了认识的深度,关注问题的深度决定的对问题的了解程度。对事物的认识就是在自己的头脑中从0到1把...

网友评论

    本文标题:运维常见错误及问题定位分析

    本文链接:https://www.haomeiwen.com/subject/hnoyxhtx.html