美文网首页微服务那些事
Polly-故障处理和弹性应对很有一手

Polly-故障处理和弹性应对很有一手

作者: Code综艺圈 | 来源:发表于2021-04-19 09:00 被阅读0次

前言

对于运行中的系统,可以说百分百的小伙伴会经常遇见以下问题:

  • 网络不通,突然又好了;

  • 服务器宕机了;

  • 调用服务接口超时了;

  • 调用接口报错啦;

  • 通讯信息发送失败需要重发;

以上只是列举了一些常遇到的问题,对于一些小项目可能简单的处理一下就OK了(比如重启或是重新发布),而对于微服务架构的项目,可能因为一个服务挂掉、或是一台服务器宕机、又或是网络出现波动等情况,都可能会导致业务流程失败,甚至会导致整个系统崩掉。所以对于系统瞬时故障需及时做出应对策略,对于可能会发生的故障需提前预防(弹性应变);Polly这个库针对以上等情况进行封装,通过策略的方式,灵活处理相关场景。

正文

1. 简介

Polly是一种.NET弹性和瞬态故障处理库,可以通过不同策略处理和应对故障场景,主要分为两大类:被动策略和主动策略,各自包含如下功能:

1.1 被动策略

主要针对故障的处理,避免如下:

  • 重试(Retry):在实际应用场景中往往有些失败只是瞬时的,经过短暂的延时就可恢复,这种情况就可以采用重试策略;

  • 熔断(Circuit Breaker):比如在调用接口发生异常时,当多次都返回异常,建议先熔断一段时间,即不再处理业务接口,直接报错;待熔断时间过了之后可以重新处理请求,即快速响应失败比让用户一直等待要合理;

  • 回退(Fallback):如果失败之后怎么处理?即在发生故障的时候找一个替代逻辑进行处理, 比如返回指定的结果或是进行下一步操作;

1.2 主动策略

主要是进行弹性扩展,而不是针对故障处理,关键点是改变原有业务逻辑的执行行为,比如原业务逻辑超时了,就会执行指定的超时处理行为;

  • 超时(Timeout ):确保调用者永远不需要等待超过配置的超时时间,不然就会触发超时异常;主要就是为了提升用户体验;

  • 舱壁隔离(Bulkhead Isolation):即一个服务的故障不应该影响到整个系统(隔离);通过控制资源消耗,避免一个故障导致级联服务也故障,最终影响整个系统;目的就是进行并发控制(限流),避免故障带来的大范围影响。

  • 缓存(Cache):将数据存入缓存中,后续的响应可以从缓存中获取; 目的就是为了提升性能;

  • 策略包装( PolicyWrap):策略可以组合进行使用;目的就是为了方便各种策略组合进行业务故障处理;

大概理解Polly功能之后,接下来就通过Demo的形式进一步了解各策略的使用;

2. 功能Demo演示

Polly使用步骤很简单,两个步骤完事:

  • 定义策略;

  • 执行策略;

以下的各功能的演示,主要体现的是用法,不会所有情况都举例演示,仅提供思路;其中说明主要结合代码,以注释为主:

2.1 重试(Retry)

代码实现:

image

运行结果(测试的时候,用Release模式或者直接执行编译后的执行文件,不然Debug模式的时候遇见异常会提示,查看结果不方便):

image

上面逻辑是失败就重试,其实在实际应用场景,通常有一个时间间隔重试,每次重试递增的时间不一样,代码如下:

image

运行结果如下:

image
2.2 熔断(Circuit Breaker)

代码实现:

image

运行结果:

image

上面这种只是常规熔断方式,Polly还提供高级熔断配置,根据熔断比率进行熔断,更加符合应用场景,通过设置样本收集时间,然后计算收集的业务处理结果比率,如果达到熔断比率就进行熔断。代码如下:

image

运行效果如下:

image
2.3 回退(Fallback)

代码实现如下:

image

运行结果:

image

当异常发生的时候,也可以指定对应的操作逻辑。

2.4 超时(Timeout )

代码实现:

image

运行结果:

image

超时这分为乐观超时(Optimistic timeout)和悲观超时(Pessimistic timeout),乐观超时需要CancellationToken 在业务逻辑中进行取消,而悲观超时没有取消的话,超时了还会继续执行,上面的案例就显示了,当触发超时之后,业务逻辑等待一段时间之后,还会返回结果,这个过程是需要耗费相关性能的;根据需要可以自行选择。乐观超时就不演示了,和正常线程逻辑一样,通过CancellationToken取消即可。

超时策略的最终目的就是考虑到用户体验,及时给用户反馈,不让用户一直处于等待中~~~~

2.5 舱壁隔离(Bulkhead Isolation)

代码实现:

image

运行效果:

image

其实在设置策略参数的时候,还可以指定等待队列的数,也就是说当业务执行数达到设置并发数时,还可以继续执行业务,只是这些业务先会进入等待队列中;这里就不详细演示了,后续在API中在具体说明,对于限流这块,放在API那块可能更容易理解,这里就先进了解。

2.6 缓存(Cache)

缓存这块演示的是基于内存的,需要额外引入包Polly.Caching.Memory和Microsoft.Extensions.Caching.Memory,关于MemoryCache的具体细节,可以参考这篇文章(因MemoryCache闹了个笑话)。

代码实现:

image

运行效果:

image

关于缓存这块,也是可以集成Redis进行做分布式缓存的。后面的项目分享的时候再详细说,如果小伙伴好奇,可以参照官网,用法和上面一样,只是引用的包不一样而已。

2.7 策略包装( PolicyWrap)

代码及运行效果:目的就是为了组合策略,应对业务逻辑的各种情况。

image

上述只是演示了常用的策略使用方式,并没有面面俱到,更加详细内容可以参照官网,结合我的演示思路,看官网例子就很容易啦:

官网地址:https://github.com/App-vNext/Polly/wiki/PolicyWrap

总结

关于Polly,就先说到这,后面的Demo或项目中肯定还会用到的,在这里用控制台项目的方式演示,一方面是为了方便,针对某个点好测试,另一方面是为了说明Polly不是针对WebAPI调用采用的,而是根据需要在项目其他任何地方都可以用(好多小伙伴都认为只是用于HttpClient调用API);

Polly了解大概情况之后,下期继续接着网关(Ocelot)剩下的功能进行分享~~~

一个被程序搞丑的帅小伙,关注"Code综艺圈",跟我一起学~~~

相关文章

  • Polly-故障处理和弹性应对很有一手

    前言 对于运行中的系统,可以说百分百的小伙伴会经常遇见以下问题: 网络不通,突然又好了; 服务器宕机了; 调用服务...

  • Polly 故障处理

    Polly是一种.NET弹性和瞬态故障处理库,允许我们以非常顺畅和线程安全的方式来执诸如行重试,断路,超时,故障恢...

  • Hystrix

    Hystrix Hystrix 是用于处理延迟和容错的开源库; Hystrix 主要用于避免级联故障,提高系统弹性...

  • istio熔断

    熔断,是创建弹性微服务应用程序的重要模式。熔断能够使您的应用程序具备应对来自故障、潜在峰值和其他 未知网络因素影响...

  • 线上故障处理书目录

    线上故障处理之故障信息获取源 线上故障处理之处理流程 线上故障处理之故障后处理

  • 如何做好云主机的安全防护管理呢?

    云主机是一种简单高效、安全可靠、处理能力可弹性伸缩的计算服务,具有自助管理、数据安全保障、自动故障恢复和防网络攻击...

  • redis持久化

    为了更好应对故障恢复。

  • Sun JDK监控和故障处理工具

    Sun JDK监控和故障处理工具

  • 荐读 | 《剧变》——贾雷德·戴蒙德

    从几个国家的危机处理案例分析总结出应对危机的原则。 国家危机应对处理的几个案例很有意思,特别是芬兰,可惜对中国的问...

  • 六年打磨!阿里开源混沌工程工具 ChaosBlade

    阿里妹导读:减少故障的最好方法就是让故障经常性的发生。通过不断重复失败过程,持续提升系统的容错和弹性能力。今天,阿...

网友评论

    本文标题:Polly-故障处理和弹性应对很有一手

    本文链接:https://www.haomeiwen.com/subject/azoulltx.html