美文网首页收藏
OAP平台规划设计

OAP平台规划设计

作者: sknfie | 来源:发表于2023-04-30 13:57 被阅读0次

作为夜莺平台Nightingale架构师,我将为您提供有关监控告警日志平台的规划和设计建议。我们的监控告警日志平台将包含采集器功能,使用Prometheus、Elasticsearch和Skywalking。

以下是我们建议的功能和参数:

监控指标采集:我们将使用Prometheus作为我们的监控指标采集工具,以收集有关应用程序、服务器、网络和其他关键指标的数据。Prometheus支持多种数据格式,例如PromQL查询语言、Grafana数据源格式等,可以在我们的监控平台中使用。

数据存储:我们将使用Elasticsearch作为我们的数据存储引擎,以存储从Prometheus中收集的数据。 Elasticsearch支持高性能数据查询和分析,可以让我们快速查找和分析存储的监控数据。

数据可视化:我们将使用Grafana作为我们的数据可视化工具,以帮助我们更好地理解和展示我们的监控数据。 Grafana提供了多种图表和面板类型,可以帮助我们快速构建数据可视化界面。

告警模板和规则:我们将使用Prometheus Alertmanager作为我们的告警模板和规则管理工具。 Alertmanager支持基于监控指标的条件告警、基于时间规则的告警等多种告警方式,并可以将告警信息发送到多种通知渠道,例如电子邮件、短信等。

数据分析和处理:我们将使用Skywalking作为我们的数据分析和处理工具,以帮助我们更好地分析和处理从Elasticsearch中获取的监控数据。 Skywalking支持多种数据处理和分析方式,例如基于规则的告警、基于异常检测的告警等,可以让我们更好地了解我们的应用程序和系统状态。

可扩展性和高可用性:我们将设计一个可扩展和高可用的监控告警日志平台,以应对未来业务增长和高流量的情况。我们将使用Kubernetes进行容器化部署,并设计高可用的架构,以确保我们的平台能够稳定运行并提供最佳性能。

以上是我们建议的监控告警日志平台的规划和设计。如果您需要更多的建议或有任何问题,请随时联系我。
如果要自研一个监控告警平台,并将Prometheus、Elasticsearch和Skywalking集成进去,以下是一些可以提供的功能和对应的原型设计:

仪表盘功能

仪表盘页面提供多种展示方式,如图表、表格、列表等,支持多种指标的展示和对比
可以根据需要选择多个指标展示在同一个仪表盘中
支持自定义时间段、时间粒度、聚合方式等参数,以便用户可以快速定位和解决问题
可以在仪表盘中设置告警规则,并且可以直接跳转到告警规则的页面
告警规则功能

告警规则页面提供多种告警方式,如邮件、短信、微信等,用户可以选择需要的方式
支持设置告警级别和触发条件,如阈值、时间间隔等参数
支持自定义告警信息,以便用户可以快速定位和解决问题
支持告警规则的导入和导出,方便用户备份和迁移
历史数据查询功能

历史数据查询页面提供多种查询方式,如按时间、按指标等,用户可以根据需要查询历史数据
支持多种展示方式,如图表、表格、列表等,用户可以根据需要选择展示方式
支持自定义时间段、时间粒度、聚合方式等参数,以便用户可以快速定位和解决问题
可以将查询结果导出为Excel等格式,方便用户分析和分享
日志查询功能

日志查询页面提供多种查询方式,如按时间、按关键字等,用户可以根据需要查询日志信息
支持多种展示方式,如列表、表格等,用户可以根据需要选择展示方式
支持自定义时间段、关键字、日志级别等参数,以便用户可以快速定位和解决问题
可以将查询结果导出为Excel等格式,方便用户分析和分享
采集器管理功能

采集器管理页面提供多种管理方式,如新增、修改、删除等,用户可以根据需要管理采集器
支持多种采集方式,如agent、exporter等,用户可以根据需要选择采集方式
支持自定义采集参数,以便用户可以根据自己的需求进行配置
支持采集器的导入和导出,方便用户备份和迁移
以上是一些可以提供的功能和对应的原型设计,每个页面需要包含的参数可能有:
数据可视化
功能描述:将采集到的监控数据进行可视化展示,以便于用户更加直观地了解系统的运行情况。
页面设计:提供多种图表展示方式,如曲线图、柱状图、饼图等,用户可以选择不同的展示方式,同时可以根据需要选择时间范围、指标等条件进行展示。页面可以支持多个图表的同时展示,用户可以通过拖拽方式调整图表大小、位置等属性。页面底部提供数据表格展示当前图表中数据的详细信息,支持数据排序、筛选等操作。
页面参数:
图表类型:曲线图、柱状图、饼图等;
时间范围:如1小时、6小时、1天、1周等;
指标:需要展示的监控指标;
维度:按照不同的维度进行展示,如IP、业务线等;
数据粒度:如1分钟、5分钟、15分钟等;
数据排序:按照指标值升序或降序排序;
数据筛选:根据指标值进行数据筛选。
告警历史记录
功能描述:展示历史告警的记录,包括告警时间、告警对象、告警级别、告警状态等信息,方便用户查看历史告警信息。
页面设计:页面以列表形式展示历史告警信息,每一条记录包括告警时间、告警对象、告警级别、告警状态、告警内容等信息。用户可以通过筛选条件进行历史告警记录的查询,同时支持导出历史告警记录。
页面参数:
筛选条件:告警对象、告警级别、告警状态等;
导出记录:支持导出历史告警记录为Excel或CSV格式。
告警通知管理
功能描述:管理告警通知方式,包括邮件、短信、微信等通知方式,以及通知人员等信息。
页面设计:页面提供告警通知方式的管理功能,支持新增、编辑、删除告警通知方式,同时支持设置通知人员等信息。页面同时支持测试告警通知的功能,用户可以通过测试告警通知方式来验证配置的正确性。
页面参数:
告警通知方式:邮件、短信、微信等;
通知人员:管理告警通知的人员;
测试告警通知:测试告警通知方式的正确性。
告警模板管理
功能描述:管理告警模板,包括告警策略、告警方式、告警内容等
告警接收器配置页面
描述:在这个页面上,用户可以配置告警接收器的相关参数,例如接收器的名称、类型、接收地址等。
页面参数:
接收器名称
接收器类型(例如邮件、短信、微信等)
接收地址
是否启用该接收器
历史告警查询页面
描述:在这个页面上,用户可以查询历史告警信息,可以按照时间、级别、对象等维度进行筛选。
页面参数:
告警级别(例如warning、critical等)
告警对象(例如主机、应用、容器等)
告警时间范围
告警内容关键字
告警统计页面
描述:在这个页面上,用户可以查看告警信息的统计数据,例如告警数量、告警级别分布、告警对象分布等。
页面参数:
时间范围
统计维度(例如级别、对象、接收器等)
以上是自研监控告警平台的主要功能和页面设计,通过这些功能,用户可以实现对系统的全面监控和告警管理,提高系统的稳定性和可靠性。

相关文章

  • 详解 Apache SkyWalking OAP 的分布式计算

    SkyWalking的OAP(Observability Analysis Platform,观测分析平台)是一个...

  • 什么是【OAP】

    OAP 叫做面向切面编程(Aspect Oriented Programming,是一种程序设计规范,它主要针对业...

  • skywalking docker安装

    skywalking UI 镜像安装 获取镜像: 运行镜像: SW_OAP_ADDRESS:oap的服务地址 sk...

  • R语言线性回归

    1、导入数据 2、绘制OAP评分和DON含量的散点图 3、计算OAP和DON的直线相关系数 4、检验直线相关系数的...

  • Docker 部署 SkyWalking OAP & U

    ▶ 获取镜像 当前版本:6.1.0自制镜像:Docker 镜像 - 构建 SkyWalking OAP & UI ...

  • 2016年度总结(个人wiki迁出)

    营销平台规划之营销现状营销平台规划之系统规划营销平台规划之领域划分可用性&稳定性保障[营销系统整体迁移]

  • 财富管理业务的打开方式

    资产管理平台,是将“经济活动”中的机会,通过各种交易结构设计,形成金融产品的组织。 事务管理平台,是提供税务规划、...

  • 四方智业文旅联盟

    1、结构性板块 ☞教育培训 ☞投融资 ☞规划设计 ☞项目建设 ☞市场营销 ☞景区托管 ☞平台建设 ☞文化创意 2、...

  • 互联网电子商务相关岗位

    相关岗位 技术类 ⒈电子商务平台设计(代表性岗位:网站策划/编辑人员):主要从事电子商务平台规划、网络编程、电子商...

  • b端产品规划的小思考

    最近在平台内规划创作者平台,发现产品创建之处,如果底层架构设计的不合理,那么后续的产品迭代,要么迁就,要么重起炉灶...

网友评论

    本文标题:OAP平台规划设计

    本文链接:https://www.haomeiwen.com/subject/ruenjdtx.html