ULTRON 分布式监控系统

ULTRON 分布式监控系统

作者: 架构技术专栏 | 来源:发表于2017-10-20 17:06 被阅读91次

ULTRON 分布式监控系统
基于docker部署的项目如何和skywalking agent
中国分布式光伏发电（8）
分布式监控系统Zabbix3.2监控数据库的连接数
微服务-springcloud-链路监控
CAT分布式监控系统
Zabbix学习01---Nginx编译安装
SkyWalking初探
透过CAT,来看分布式实时监控系统的设计与实现
基于JavaAgent的全链路监控一《嗨！JavaAgent》

概述

在今天这个时代，数据已经成为重要的资源，小到管理系统大到智能AI都脱离不了数据的支持。在面对海量数据的压力下，传统项目不能不走上了变迁的道路。生存还是毁灭，看你自己咯。从传统一个war包走天下，到模块化的SOA，在演变到现今火的不行的微服务。系随着系统变得越来越轻量化，扩展性更强，拆分力度更细致，就必然导致了性能测试，异常排除复杂度的升高。

典型问题有：

大量报错，特别是重要的服务，排查时间可能会很久
异常查看需要到机器上一个个的搜（虽然我们有elk），处理问题实际时间太长了
简单错误的问题定位扯皮，组与组之间协调起来也是麻烦的
很多问题不了了之，因为根本不知道发生了什么鬼，哪里发生的，只能怀疑网络问题

虽然也有Zabbix等系统，但那毕竟是监控服务的维度和力度还是不够的，所以开发一个分布式服务监控系统也就势在必行了，方向就是Google Dapper这篇论文了，所以在10月我们完成了ULTRON一期。

整体设计

监控系统要求就是快速定位问题，及时发现故障，在不影响应用处理能力的情况下尽可能的收集数据。
一期目前实现以下功能：

全量采集：设计为服务调用数据全量采集
实时推送：服务信息接近实时被推送到处理应用
异常报警：实时推送报警信息到微信、邮件、短信等渠道
服务排行榜：可根据排行榜发现有潜在危险的应用
故障容忍：ULTRON本身出现问题不影响现有业务正常运转，只是监控能力变弱
高吞吐：因为需要全方位监控服务，获取完整信息，必须有超强的吞吐量
可扩展：支持分布式部署，可任意横向扩展
不保证可靠性：为了保证超强的吞吐量，允许消息丢失
低侵入性：为了保证不影响现有业务，增加其复杂度，ULTRON采用了低侵入抓取数据

架构图

ULTRON架构图

实时分析

ULTRON借助于DUBOO SPI机制对应用进行低侵入式扩展，内置集成轻量级KAFKA客户端，实现海量数据推送，并且增强自身的故障容忍机制，在应用负载压力高峰时期会主动降低推送数据的频率。
ULTRON服务端对数据进行了流式处理，比如排行榜等信息皆来源于此，未来的报表等处理将接入流处理模块进行。

存储设计

在存储上，一期为了快速迭代采用Mysql HDFS Redis进行辅助数据处理，因为实时查询数据是经过处理的，WatchDog展现的数据对现有Mysql压力非常小。估量依照现有数据量，每日流入数据大概1000W左右，当然对于存储我们已经有了更好的方案，等待二期进行快速迭代。

消息ID设计

系统ID设计理念-Trace树

在分布式追踪系统中，唯一ID的设计是非常重要的，系统基本功能全是依靠于ID进行展现的。借助于Google Dapper 阿里鹰眼系统的借鉴完成了自身ID的穿织。举例：真正ID为e8aaafe039ee42919b6e493fb364e356-0.1.1

页面展示-首页

页面展示-首页.jpg

页面展示-服务监控

页面展示-服务监控 .png

页面展示-服务追踪

页面展示-服务追踪 .png

未来

目前ULTRON系统基本完成对于服务监控的功能，但对于整个监控体系来说只是其核心的一块，还欠缺着周边配套的数据检索动态报表展示等。
下面就罗列下二期准备增加的辅助功能：

应用拓扑图完善
性能瓶颈的预测
根据当前调用比例、QPS等评估容量
对于redis 、mysql、mq线程监控数据收集（目前MQ mysql数据已经采样完毕）
数据存储方案的优化
实现针对于用户权限的实现（方便各个业务线只关注自身应用）
流式处理数据方案的升级改造

日常生活

相关文章

ULTRON 分布式监控系统
概述在今天这个时代，数据已经成为重要的资源，小到管理系统大到智能AI都脱离不了数据的支持。在面对海量数据的压力下...
基于docker部署的项目如何和skywalking agent
skywalking简介 skywalking是一款开源的应用性能监控系统，包括指标监控，分布式追踪，分布式系统性...
中国分布式光伏发电（8）
质量监控篇 83.为什么要重视分布式光伏发电系统的质量监控？首先分布式光伏发电系统多是与建筑相结合，若是系统质量...
分布式监控系统Zabbix3.2监控数据库的连接数
在分布式监控系统Zabbix3.2跳坑指南和分布式监控系统Zabbix3.2给异常添加邮件报警已经介绍了如何安装以...
微服务-springcloud-链路监控
一个完整的分布式系统，除了系统本身，强调的就是监控，通过监控系统，出问题后可以迅速判断问题出在哪个地方。监控组件...
CAT分布式监控系统
CAT分布式监控系统（一）：CAT功能介绍 CAT监控系统是什么、能做什么？_tjiyu的博客-CSDN博客_...
Zabbix学习01---Nginx编译安装
前言 1.1企业级Zabbix监控系统介绍所有监控配置都WEB化，支持分布式监控支持多种方式数据采集：简单监控...
SkyWalking初探
观察与监控分布式系统，监控调用链路项目主页: https://skywalking.apache.org[ht...
透过CAT,来看分布式实时监控系统的设计与实现
透过CAT,来看分布式实时监控系统的设计与实现
基于JavaAgent的全链路监控一《嗨！JavaAgent》
全链路监控又名分布式监控系统全链路追踪，目前市面的全链路监控系统基本都是参考Google的Dapper（大规模分布...

网友评论

本文标题：ULTRON 分布式监控系统

本文链接：https://www.haomeiwen.com/subject/immvuxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|ULTRON 分布式监控系统|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！