美文网首页
RabbitMQ监控

RabbitMQ监控

作者: 大胖子与小胖子 | 来源:发表于2018-07-05 16:32 被阅读0次

1、搜集日志信息

通过ELK搜集集群节点中的日志信息,对于ERROR信息,进行邮件告知相关的维护人员及时进行处理。

2、监控硬件资源及进程

公司已经有监控系统,直接将如下磁盘、内存及端口、URL信息在监控中进行配置即可。

磁盘

监控每台服务器的磁盘空间,重点监控如下两个目录:

  • log目录

即/app/log 目录。日志文件可以通过定期压缩清理,保证控制在一定的大小内。

  • data目录

即/app/data 目录,这个目录主要堆积的数据还是未消费的已经持久化到磁盘上的消息。这个需要及时对消息进行监控。

内存

监控服务器的内存使用情况,当达到阀值的情况下,进行提前告警。

监控进程

主要是监控5672端口,及http://xxxx:15672访问地址

3、通过rest接口进行监控

依托于rabbitmq提供的强大的rest api,我们可以很方便的获取到集群中的各个节点信息,从而根据具体的需求,进行全方位的监控。

在公司已经采购的监控系统和自行搭建的zabbix监控中,都能够很好的支持rest api。可以通过监控系统对json结果的解析,达到告警的目的。

消息监控

消息监控可以通过定时调用rest接口,获取队列的未消费数量,对超过一定数量的mq消息,提供短信邮件告警;

  • 获取消息的rest接口地址为:

http://xxx:15672/api/queues

  • 消息内容示例(只截取部分内容):
[{
    "memory": 55568,
    ...
    "messages": 21,                              #消息总数量
    ...
    "messages_ready": 21,                        #待处理消息数量
    ...
    "messages_unacknowledged": 0,                #未确认消息数量
    ...
    "idle_since": "2018-07-02 14:02:04",
    "consumer_utilisation": null,
    "policy": "hao123",
    "exclusive_consumer_tag": null,
    "consumers": 0,
    "slave_nodes": ["rabbit@rabbitmqstg03", "rabbit@rabbitmqstg04"],
    "synchronised_slave_nodes": ["rabbit@rabbitmqstg03", "rabbit@rabbitmqstg04"],
    "recoverable_slaves": ["rabbit@rabbitmqstg03", "rabbit@rabbitmqstg04"],
    "state": "running",
    ...
    "message_bytes_ram": 13086,                  #消息占用的内存大小
    "message_bytes_persistent": 2816,            #消息占用的磁盘大小
    ...
    "name": "ha.queue_123",
    "vhost": "/123",
    "durable": true,
    "auto_delete": false,
    "exclusive": false,
    "arguments": {},
    "node": "rabbit@rabbitmqstg02"
}]

文件描述符、socket文件描述符、erlang进程监控

通过rest接口获取到每个集群中的节点信息,通过实际值和阀值的大小,及时的进行告警,这一步告警方式,可以根据严重程度,依次邮件、微信、短信通知到相关的人员。

  • 获取节点的rest接口地址为:

http://xxx:15672/api/nodes

  • 集群节点内容示例(只截取部分内容):
[{
    "cluster_links": [{
        "peer_addr": "10.1.110.39",
        "peer_port": 51715,
        "sock_addr": "10.1.110.37",
        "sock_port": 25672,
        "stats": {...},
        "name": "rabbit@rabbitmqstg04"
    }, ...],
    "disk_free": 28271468544,                 # 磁盘使用量
    "fd_used": 58,                            # 文件描述符使用数
    ...
    "mem_used": 58362720,                     # 内存使用量
    "mnesia_disk_tx_count": 7,
    "mnesia_ram_tx_count": 13108,
    "proc_used": 225,                         # erlang进程使用数
    "sockets_used": 0,                        # socket描述符已经使用数
    "fd_total": 65536,                        # 文件描述符总数
    "sockets_total": 58890,                   # socket描述符总数
    "mem_limit": 1607527628,                  # 内存阀值
    "disk_free_limit": 10000000000,           # 磁盘阀值
    "proc_total": 1048576,                    # erlang进程总数
    ...
    "log_file": "/app/rabbitmq/rabbitmq_server-3.6.1/log/rabbitmq/rabbit@rabbitmqstg02.log",
    "sasl_log_file": "/app/rabbitmq/rabbitmq_server-3.6.1/log/rabbitmq/rabbit@rabbitmqstg02-sasl.log",
    "db_dir": "/app/rabbitmq/rabbitmq_server-3.6.1/data/rabbit@rabbitmqstg02",
    "config_files": ["/app/rabbitmq/rabbitmq_server-3.6.1/etc/rabbitmq/rabbitmq.config"],
    ...
    "name": "rabbit@rabbitmqstg02",
    "type": "disc",
    "running": true
}]

4、监听堵塞消息

可以在MQ中专门创建一个监控的队列,定时的发送和消费队列中的消息,并且通过的如下的代码去监控队列是否已经堵塞,如果监听到队列已经堵塞,就立即发送告警的短信和邮件。

关于是否需要手动将故障机器剔除集群,这个有待商榷,但是如果要做的话,是可以在这里做到的。

ConnectionFactory factory = new ConnectionFactory();
Connection connection = factory.newConnection();
connection.addBlockedListener(new BlockedListener() {
    public void handleBlocked(String reason) throws IOException {
        // Connection is now blocked
    }

    public void handleUnblocked() throws IOException {
        // Connection is now unblocked
    }
});

相关文章

  • rabbitmq的队列消息累积监控总结

    目标:对rabbitmq的队列进行消息累积监控。整体思路: 根据rabbitmq提供的API,获取要监控的队列信息...

  • rabbitmq操作

    rabbitMQ 常用命令 启动监控管理器:rabbitmq-pluginsenablerabbitmq_mana...

  • rabbitMq管理-rabbitmqadmin

    RabbitMQ之管理与监控Rabbitmq学习之路2-rabbitmqctlRabbitMQ-官方指南-rabb...

  • rabbitMQ常用的命令

    启动监控管理器 关闭监控管理器 启动rabbitmq 关闭rabbitmq 查看所有的队列 清除所有的队列 用户和...

  • RabbitMQ监控

    1、搜集日志信息 通过ELK搜集集群节点中的日志信息,对于ERROR信息,进行邮件告知相关的维护人员及时进行处理。...

  • rabbitmq常用命令

    查看插件打开情况:rabbitmq-plugins list 启动监控管理器:rabbitmq-plugins e...

  • Mac安装erlang和rabbitmq

    安装erlang环境 安装rabbitmq 安装RabiitMQ的可视化监控插件 配置环境变量 后台启动rabbitMQ

  • 【rabbitMQ】用Prometheus 监控RabbitMQ

    从3.8.0开始,RabbitMQ提供内置的Prometheus和Grafana支持。rabbitmq_prome...

  • 【Mac安装RabiitMQ】

    下载安装RabbitMQ 安装RabiitMQ的可视化监控插件 配置环境变量(好像不配置也行) 后台启动rabbitMQ

  • Kafka RabbitMQ队列监控

    1.部署(后面补充)官网有很详细的步骤可以参考。 2.启动启动时,没有看到报错,但是实际没启动成功。最后,去到安装...

网友评论

      本文标题:RabbitMQ监控

      本文链接:https://www.haomeiwen.com/subject/clbpuftx.html