美文网首页
rancher部署k8s集群,故障处理

rancher部署k8s集群,故障处理

作者: 彩色的炮灰 | 来源:发表于2022-09-07 13:35 被阅读0次

    K8s集群是通过rancher部署的。

    一、第一步先修复rancher。可以登陆rancher后其他错误可方便查看。

    • 首先通过查看rancher容器启动方式可知:docker run 启动是单节点部署。
    • 重启rancher容器,无法恢复。
    • 重启docker,后rancher恢复。可以登陆web页面。
    image.png

    二、通过上面图片可知,k8s集群不可用。但是local集群的k3s是正常的。

    • 我们先处理ops集群。Ops集群是运维相关业务。
      根据报错可知,有2台master节点不正常。重启docker无法处理。故决定重启服务器。重启服务
      器后还是无法正常,可能会有磁盘、io等相关报错。并且此时kubectl命令无法使用。到此我们先处理kubectl无法使用故障。此故障是证书相关。
    • Rancher证书过期,翻看rancher官网,可以通过修改rancher容器更新证书。方法如下:https://docs.rancher.cn/docs/rancher2/trending-topics/certificate-rotation/_index/

    三、更新证书后,集群恢复正常。如下状态:表面 ,但是还有一些其他问题,需要逐步处理。修复nesux3容器后,ops报错全部处理完成

    image.png

    相关文章

      网友评论

          本文标题:rancher部署k8s集群,故障处理

          本文链接:https://www.haomeiwen.com/subject/ndkonrtx.html