美文网首页
moosefs分布式文件系统无响应

moosefs分布式文件系统无响应

作者: 六弦极品 | 来源:发表于2019-07-09 11:33 被阅读0次

1. 问题现状

各个挂载moosefs 的系统或站点,出现大量502错误,最后系统、网站完全瘫痪。

2. 分析

登陆到出现502错误的的系统服务器,服务器系统负载特别高,CPU,内存都正常,本地磁盘IO也正常,netstat命令查看Recv-Q队列积压特别高,此时可以看到是MFS分布式出现了问题。
到moosefs master 的日志,出现如下错误日志:

Oct 10 13:01:49 VM_200_107 mfsmaster[31003]: connection with client(ip:172.16.200.81) has been closed by peer
Oct 10 13:01:49 VM_200_107 mfsmaster[31003]: connection with client(ip:172.16.115.33) has been closed by peer
##表示客户端和master的连接中断
Oct  4 08:01:28 VM_200_107 mfsmaster[2843]: connection with CS(172.16.200.102) has been closed by peer
Oct  4 08:01:28 VM_200_107 mfsmaster[2843]: connection with CS(172.16.200.103) has been closed by peer
Oct  4 08:01:28 VM_200_107 mfsmaster[2843]: connection with CS(172.16.200.104) has been closed by peer
##表示ChunkServer和Master的连接中断
Oct  4 08:01:28 VM_200_107 mfsmaster[2843]: chunkserver disconnected - ip: 172.16.200.102, port: 9422, usedspace: 463146741760 (431.34 GiB), totalspace: 2054567444480 (1913.47 GiB)
Oct  4 08:01:30 VM_200_107 mfsmaster[2843]: chunkserver disconnected - ip: 172.16.200.103, port: 9422, usedspace: 459528495104 (427.97 GiB), totalspace: 2054567444480 (1913.47 GiB)
Oct  4 08:01:31 VM_200_107 mfsmaster[2843]: chunkserver disconnected - ip: 172.16.200.104, port: 9422, usedspace: 461537153024 (429.84 GiB), totalspace: 2054567444480 (1913.47 GiB)
##ChunkServer 中断连接
Oct 10 13:01:52 VM_200_107 mfsmaster[31003]: connection with ML(127.0.0.1) has been closed by peer
##表示Metalogger和Master的连接中断
Oct 10 13:01:52 VM_200_107 mfsmaster[31003]: chunkserver register begin (packet version: 5) - ip: 172.16.200.102, port: 9422
Oct 10 13:01:52 VM_200_107 mfsmetalogger[31700]: connection was reset by Master
Oct 10 13:01:53 VM_200_107 mfsmaster[31003]: chunkserver register begin (packet version: 5) - ip: 172.16.200.103, port: 9422
Oct 10 13:01:54 VM_200_107 mfsmaster[31003]: chunkserver register end (packet version: 5) - ip: 172.16.200.102, port: 9422, usedspace: 490665570304 (456.97 GiB), totalspace: 2054567444480 
Oct 10 13:01:54 VM_200_107 mfsmaster[31003]: chunkserver register end (packet version: 5) - ip: 172.16.200.103, port: 9422, usedspace: 486941249536 (453.50 GiB), totalspace: 2054567444480 
##chunkserver重新连接

每到整点的时候,master 会fork一个子进程把内存中的数据快照到磁盘,如果数据量小或者磁盘很快,是不会影响master的响应的。一旦数据比较大或者磁盘很忙时(并且master还有很多访问),写快照的进程会让磁盘变得繁忙,导致另一个master进程在写changelog 时被阻塞了。

3. 解决改进

改进办法是使用更好的磁盘(SSD)或者更多内存(使得新写的快照不必立即刷新到磁盘),临时解决把swap分区扩大

相关文章

  • moosefs分布式文件系统无响应

    1. 问题现状 各个挂载moosefs 的系统或站点,出现大量502错误,最后系统、网站完全瘫痪。 2. 分析 登...

  • mfs分布式文件系统搭建

    一、简介 MFS一般指MooseFS,分布式文件系统,比如谷歌的GFS,Apache的HDFS。 MooseFS ...

  • MooseFS安装配置

    简介 MooseFS 是一个分布式文件系统,支持以客户端挂载的形式开放给用户使用。 主要角色 master 节点:...

  • MooseFS在Ubuntu16下的安装

    MooseFS是一个优秀的分布式文件系统,挂载后和读写本地磁盘上的文件无异,是替代NFS的理想选择。 不过Moos...

  • Moosefs文件系统搭建

    系统Centos 7 MfsMaster:192.168.1.100MfsChukserver1:192.168....

  • 软件篇-分布式文件系统(一) - FastDFS介绍与普通安装

    分布式文件系统 1.分布式文件系统是什么 分布式文件系统(Distributed File System)是指文件...

  • 第五周周报 - 草稿

    HDFS分布式文件系统 Hadoop文件系统使用分布式文件系统设计开发。它是运行在普通硬件。不像其他的分布式系统,...

  • MFS安装

    mfs github地址:https://github.com/moosefs/moosefs 一. 准备 1. ...

  • 6 Ceph

    Ceph概述 [toc] 分布式文件系统 分布式文件系统( Distributed File Syste ) 是指...

  • Hadoop文档(2.9.2) - HDFS架构

    介绍 Hadoop分布式文件系统(HDFS)是一种运行在通用硬件上的分布式文件系统。它与传统的分布式文件系统有很多...

网友评论

      本文标题:moosefs分布式文件系统无响应

      本文链接:https://www.haomeiwen.com/subject/quztkctx.html