美文网首页
服务端线上接口监控实践

服务端线上接口监控实践

作者: 夜境 | 来源:发表于2017-09-13 10:07 被阅读449次

本文章转载于搜狗测试

背景

最近上线了一个新的服务,这个服务有一个特点就是接入了n个第三方的数据服务,前端通过不同参数请求被测服务端,服务端根据参数不同proxy_pass到不同的后端服务器获取数据,处理后吐给前端展示;

问题

被测服务和后端服务都上线后,发现了一些问题

1、第三方服务器可能会宕机,导致线上的被测服务功能不正常;

2、现有的报警机制是基于对服务存活的检查,无法检查功能逻辑是否正常;

问题分析

现有的监控程序是对线上服务器进行服务进程存活检查,当进程挂掉才会报警,但是有一些情况cover不到,比如后端服务挂了,那么被测服务进程还在,但是当客户端请求时,无数据返回;

解决方案

使用脚本模拟客户端不同参数的请求,验证接口返回码200的同时,验证数据内容的正确性;

例:http://abc.sogou.com?type=music,会请求后端music服务器,正常情况下有内容{“name”:”abc”}

使用python的requests库请求服务端获得返回码&返回body,验证jsonobj中 含有key = name & value = abc

当有检查点失败时,向指定邮箱发报警邮件;

ps:之前偷听到一个小技巧,报警邮件可以指定到QQ邮箱,这样有报警邮件就能及时收到,因为微信有QQ邮箱的收件提醒,是不是想说一声,卧槽~这都可以~

衍生问题

1、case维护麻烦,因为使用python unittest框架,需要将检查点和请求参数维护到代码里,这样新增case比较麻烦

2、由于case维护在代码中,查看已有case也比较麻烦;

解决方案

1、将case和检查点存在db中,修改python脚本,从db中获取case和检查点,并执行

整体流程图

添加case

自定义参数组合、预置一些通用检查点,根据实际参数组合的预期返回值,勾选检查点

执行脚本根据db中这条case写入的检查点选择执行assert

后端提供一个查询db的接口,供前台页面展示case列表(如下)

存在问题

1、目前这套系统最大的问题是扩展性不好,耦合度较大,后面可以通过完善配置的方法解耦,并增加可扩展性;

相关文章

  • 服务端线上接口监控实践

    本文章转载于搜狗测试 背景 最近上线了一个新的服务,这个服务有一个特点就是接入了n个第三方的数据服务,前端通过不同...

  • webservice

    webservice接口 跟 webapi 区别: webservice 做为服务端无法监控接口 ; webser...

  • Arthas 3.1.2 版本发布 | 增加 logger/he

    最近偶尔有用户反馈某些 HTTP 接口出现超时问题,而 web 服务端的 Trace 监控没有出现 http 返回...

  • 10.5为网站添加接口之线上HTTP接口调用

    Chapter:10.服务端环境搭建和开发过程 10.5为网站添加接口之线上HTTP接口调用 在企业里很少会用No...

  • 前端监控概览

    背景 以往我们知道的监控都是服务端的监控,前端是少有被提及的,线上的页面什么时候挂掉,挂了多长时间,什么原因导致的...

  • 招聘系统-人才库列表查询10倍性能优化实践

    背景 招聘系统中的人才库列表查询接口经常被监控系统监控到,耗时约3500ms,从服务端到web端极端情况下超过50...

  • hyperf如何接入swoole enterprise

    1.为什么要接入swoole enterprise 针对线上机器的监控、接口的调用情况、线上调试等等,这应该是每个...

  • 监控最佳实践--redis及业务接口

    简介: 监控最佳实践--redis及业务接口 1. 背景 1.1 问题 2020-12-04,客户侧redis集群...

  • 微服务架构(七)服务调用的监控

    服务调用的监控 监控的对象,指标,维度 监控的对象 客户端监控:功能的监控 接口的监控:接口调用情况的监控 资源监...

  • 数据格式

    首页1 接口1: 接口2: 首页2 接口1: 接口2: 监控页-服务器 接口1: 接口2: 筛选 监控详情 告警-...

网友评论

      本文标题:服务端线上接口监控实践

      本文链接:https://www.haomeiwen.com/subject/tddksxtx.html