美文网首页
记录一次服务器故障

记录一次服务器故障

作者: frankie_cheung | 来源:发表于2020-07-29 13:59 被阅读0次
背景

昨天本想对某个账号的下阿里云账号做一个zabbix监控,创建了一个安全组,开通10050作为zabbix服务器访问客户端的端口,然后就发生如下问题:

  • 服务器公网IP无法ping通,且无法ssh登陆
  • 服务器控制台vnc方式可以登陆,且可以进入命令行,
  • 可以登录的机器,一旦重启,则无法登陆,且使用VNC方式登录后,又可以恢复登陆
  • 在vnc方式登陆后,则可以正常ping通外网IP
  • 可以登录的外网IP,反映上去敲命令行特别卡。
  • 某一台机器的mysql 启动命令一直卡住不动,例如systemctl start mysqld
排查思路:
  • 删除我加的zabbix安全组,但是本质上公网ip无法ping通是和安全组肯定是没关系的。
  • 求助阿里云后台技术人员,他们远程协助 搞了半天 也没啥结果。
最终解决方案

最后凌晨5点多,有个阿里云的技术人员 发现我们的磁盘是按照使用量进行收费的,当时整个账号已经欠费4200元,导致整个服务器的IOPS降低为1,这也就证明为什么命令行特别卡,以及mysql启动命令一直卡住。

总结
  • 不要先去机器上排除
  • 先确保阿里云的账号是无异常的
  • 不仅要确认机器未过期,还要看是否是其他收费方式。

相关文章

网友评论

      本文标题:记录一次服务器故障

      本文链接:https://www.haomeiwen.com/subject/cephrktx.html