美文网首页
记ES集群磁盘I/O异常修复

记ES集群磁盘I/O异常修复

作者: 朝朝Mumu | 来源:发表于2022-10-08 18:17 被阅读0次

用户在例行巡检过程发现es有data节点处于停止状态,进行启动后,页面进度条显示绿色已完成,但实际进程启动失败了。

  1. 排查节点日志,发现不能访问数据路径,报错关键内容如下:
    Unable to access ‘path.data’ (/mnt/elasticsearch/slave/data)……
  2. 检查挂载磁盘,df -Thlsblk -f
    发现磁盘没有占满,使用容量还有剩余很多,文件系统为xfs
  3. cd到数据路径,没有报错,ls有报错:ls: cannot open directory Input/output error。据此怀疑磁盘或文件系统故障。我们先排除文件系统故障。
  4. 此时设备已经处于不可用状态,先尝试重启机器(reboot)-> 就这样解决了。
  5. 如果重启没有解决,依然是Input/output error,那么尝试进行文件系统修复操作如下:
    1. 从【2】中获取到要修复的挂载点,如/dev/sdb
    2. xfs的文件系统,使用如下命令进行修复:xfs_repair /dev/sdb
    3. 正常的话要提示“设备或资源忙”,"couldn't initialize XFS library",需要先取消挂载umount /dev/sdb
    4. 继续执行修复:
    xfs_repair /dev/sdb -L
    Phase 1 - find and verify superblock...
    Phase 2 - using internal log
            - zero log...
    Phase 4 - check for duplicate blocks...
            - setting up duplicate extent list...
            - check for inodes claiming duplicate blocks...
            - agno = 0
            - agno = 3
            - agno = 4
            - agno = 2
            - agno = 5
            - agno = 6
            - agno = 1
            - agno = 7
    Phase 5 - rebuild AG headers and trees...
            - reset superblock...
    Phase 6 - check inode connectivity...
            - resetting contents of realtime bitmap and summary inodes
            - traversing filesystem ...
            - traversal finished ...
            - moving disconnected inodes to lost+found ...
    Phase 7 - verify and correct link counts...
    done
    
    修复完成后再把磁盘挂上,即可生效:mount /dev/sdb /mnt/elasticsearch/data
    如果修复失败,报修。

相关文章

  • 记ES集群磁盘I/O异常修复

    用户在例行巡检过程发现es有data节点处于停止状态,进行启动后,页面进度条显示绿色已完成,但实际进程启动失败了。...

  • Linux 磁盘I/O基础知识总结

    本文用于对一些基础磁盘I/O知识的总结。 目录索引 磁盘I/O那些事 总结思维导图 磁盘I/O学习笔记 磁盘I/O...

  • MySQL企业常用集群架构

    纠结了很久,想使用磁盘技术彻底解决mysql集群架构,使用了GFS2,但暂时无法解决磁盘I/O问题;使用了Gl...

  • I/O请求的队列指标

    当磁盘I/O请求的数量超过I/O设备的处理能力时,或者当磁盘调度算法需要累计一定的I/O请求时,都会导致I/O请求...

  • I/O请求的队列指标

    当磁盘I/O请求的数量超过I/O设备的处理能力时,或者当磁盘调度算法需要累计一定的I/O请求时,都会导致I/O请求...

  • I/O查看

    网络 I/O:sar -n DEV 1 CPU I/O: vmstat 1 磁盘 I/O : sar -d 1

  • 处理Elasticsearch集群状态为yellow历程

    背景:公司的Es集群有两个Es节点,其中有一台机器磁盘不是太大,经常导致Es处于只读状态(Es在磁盘空间小于等于5...

  • Linux性能优化实战——磁盘I/O调优

    前言 本文基于文件系统和磁盘I/O工作原理,通过典型I/O问题分析,总结磁盘I/O调优的一般套路。 问题描述:文件...

  • 计算机三级错题集

    1、下列关于服务器技术的描述中,错误的是(D)。 A)服务器磁盘性能表现在磁盘存储容量与I/O速度 B)集群系统中...

  • Hadoop3 YARN集群中的磁盘I / O调度设计详解1

    问题导读 1.磁盘IO实现共享,使用的是什么原理技术? 2.如何描述磁盘I / O资源? 3.磁盘I / O资源中...

网友评论

      本文标题:记ES集群磁盘I/O异常修复

      本文链接:https://www.haomeiwen.com/subject/rpdwartx.html