美文网首页
实时监控报警系统半天搞定

实时监控报警系统半天搞定

作者: lodestar | 来源:发表于2019-08-02 09:31 被阅读0次

不知道大家有没有遇到这样的一种情况,当我们产品出现bug或无法访问的时候,客户反馈给售后或商务,售后反馈给测试,测试确认问题后,再反馈给研发,研发在根据客户提供的信息再确认是哪里问题。这个过程至少半天就过去了,而且影响在逐渐的扩大。然后商务的老大知道了,售后的老大知道了,产品、研发的老大知道了,最后CEO也知道了。可能就是一个小bug,整个公司的人都知道了。作为研发的老大,一次两次还可以顶下,但是老是这种问题,是不是压力有点大。那怎么解决这个问题呢?1.加强代码review,2.逻辑梳理,减少出错概率,3.单元测试。这些都不能避免bug的出现,我们今天要说的时候,出现bug后快速的修复,将影响面降低到最小。那怎么快速发现bug呢?有一套报警系统是不是就可以解决了。那么做一个报警系统呢?

1.错误日志收集

nginx日志、php错误日志、sql错误日志、应用错误日志。假设这些日志都打印到日志文件了,那么多台服务器的日志怎么收集呢,那就需要用到阿里云日志服务,可以将多台服务器的日志收集起来。日志服务可以根据时间间隔来筛选,并且支持正则表达式和sql查询。比如说我要查询nginx请求一分钟内的http statuscode 大于400的请求有哪些。如果大于1个,那么就需要通知研发人员和测试。或者如果请求处理时间大于1s的,我也要通知研发人员。

2.怎么通知呢

如下图右上角有个另存为告警。那就可以通过钉钉、短信、邮件方式,通知到研发人员。另外钉钉的机器人真的挺好用的,登陆钉钉桌面版,点击右上角头像-》机器人管理-》自定义,选择一个群,然后会产生一个webhook地址。只要将webhook地址加入到日志管理报警设置里面。对于不同的业务通知到不同的人,那就自己细化报警和日志吧。半天时间一个简易的监控报警就搞定啦。
日志服务的功能远远不止这些,api日志上传,各种语言java、go、php、ios、android、python等。还可以将日志在投递到OSS、MaxCompute等,再做后续的数据分析。

log.png

参考:
https://help.aliyun.com/document_detail/54604.html
https://open-doc.dingtalk.com/microapp/serverapi2/qf2nxq

相关文章

  • 实时监控报警系统半天搞定

    不知道大家有没有遇到这样的一种情况,当我们产品出现bug或无法访问的时候,客户反馈给售后或商务,售后反馈给测试,测...

  • (4)分布式系统关键技术:全栈监控

    一、监控系统需要完成的功能为: 全栈监控; 关联分析; 跨系统调用的串联; 实时报警和自动处置; 系统性能分析。 ...

  • 23运维监控服务

    综合架构监控服务概念对系统不间断实时监控 实现报警通知(邮件/微信/短信/电话/手环)实现反馈系统当前状态保证服...

  • 本司监控报警现状

    监控报警现状本司是基于open falcon进行监控报警 系统资源监控:cpu、mem、io等,都有这些监控和报警...

  • zabbix监控

    监控服务概述 1、实时查看服务状态2、可以发送报警信息(邮件报警、短信报警、电话报警、微信报警、值班(大屏幕)报警...

  • 云监控系统介绍

    云监控系统架构图 报表平台 链路散点图 故障报告 root cause analysis 调用链路 实时报警 钉钉...

  • 2017-12-25

    XMPP实时监控系统,MQTT实时监控系统,mosoquitto服务器监视系统,继电器原理:弱电控制强电;

  • NX3225SA贴片24MHz晶振,智能电子产品“专属订制”

    视频安全监控系统是一种利用视频技术实时检测和监控强化区域,实时显示和记录实时图像的电子系统或网络。网络视频监控系统...

  • 09、构建Docker容器监控系统

    1、为什么要监控?要监控什么? 监控的意义:(1) 对系统不间断实时监控(2) 实时反馈系统当前状态(3) 保证业...

  • zookeeper的watcher

    利用zk的watcher功能实时监控zk节点的变化,可以利用这个功能做报警、监控,例如监控kafka的broker...

网友评论

      本文标题:实时监控报警系统半天搞定

      本文链接:https://www.haomeiwen.com/subject/labhdctx.html