Polly-故障处理和弹性应对很有一手

作者: Code综艺圈 | 来源:发表于2021-04-19 09:00 被阅读0次

Polly-故障处理和弹性应对很有一手
Polly 故障处理
Hystrix
istio熔断
线上故障处理书目录
如何做好云主机的安全防护管理呢？
redis持久化
Sun JDK监控和故障处理工具
荐读 | 《剧变》——贾雷德·戴蒙德
六年打磨！阿里开源混沌工程工具 ChaosBlade

前言

对于运行中的系统，可以说百分百的小伙伴会经常遇见以下问题：

网络不通，突然又好了；
服务器宕机了；
调用服务接口超时了；
调用接口报错啦；
通讯信息发送失败需要重发；

以上只是列举了一些常遇到的问题，对于一些小项目可能简单的处理一下就OK了(比如重启或是重新发布)，而对于微服务架构的项目，可能因为一个服务挂掉、或是一台服务器宕机、又或是网络出现波动等情况，都可能会导致业务流程失败，甚至会导致整个系统崩掉。所以对于系统瞬时故障需及时做出应对策略，对于可能会发生的故障需提前预防(弹性应变)；Polly这个库针对以上等情况进行封装，通过策略的方式，灵活处理相关场景。

正文

1. 简介

Polly是一种.NET弹性和瞬态故障处理库，可以通过不同策略处理和应对故障场景，主要分为两大类：被动策略和主动策略，各自包含如下功能：

1.1 被动策略

主要针对故障的处理，避免如下：

重试(Retry)：在实际应用场景中往往有些失败只是瞬时的，经过短暂的延时就可恢复，这种情况就可以采用重试策略；
熔断（Circuit Breaker)：比如在调用接口发生异常时，当多次都返回异常，建议先熔断一段时间，即不再处理业务接口，直接报错；待熔断时间过了之后可以重新处理请求，即快速响应失败比让用户一直等待要合理；
回退(Fallback)：如果失败之后怎么处理？即在发生故障的时候找一个替代逻辑进行处理，比如返回指定的结果或是进行下一步操作；

1.2 主动策略

主要是进行弹性扩展，而不是针对故障处理，关键点是改变原有业务逻辑的执行行为，比如原业务逻辑超时了，就会执行指定的超时处理行为；

超时(Timeout )：确保调用者永远不需要等待超过配置的超时时间，不然就会触发超时异常；主要就是为了提升用户体验；
舱壁隔离(Bulkhead Isolation)：即一个服务的故障不应该影响到整个系统(隔离)；通过控制资源消耗，避免一个故障导致级联服务也故障，最终影响整个系统；目的就是进行并发控制（限流），避免故障带来的大范围影响。
缓存(Cache)：将数据存入缓存中，后续的响应可以从缓存中获取; 目的就是为了提升性能；
策略包装( PolicyWrap)：策略可以组合进行使用；目的就是为了方便各种策略组合进行业务故障处理；

大概理解Polly功能之后，接下来就通过Demo的形式进一步了解各策略的使用；

2. 功能Demo演示

Polly使用步骤很简单，两个步骤完事：

定义策略；
执行策略；

以下的各功能的演示，主要体现的是用法，不会所有情况都举例演示，仅提供思路；其中说明主要结合代码，以注释为主：

2.1 重试(Retry)

代码实现：

image

运行结果(测试的时候，用Release模式或者直接执行编译后的执行文件，不然Debug模式的时候遇见异常会提示，查看结果不方便)：

image

上面逻辑是失败就重试，其实在实际应用场景，通常有一个时间间隔重试，每次重试递增的时间不一样，代码如下：

image

运行结果如下：

image

2.2 熔断（Circuit Breaker)

代码实现：

image

运行结果：

image

上面这种只是常规熔断方式，Polly还提供高级熔断配置，根据熔断比率进行熔断，更加符合应用场景，通过设置样本收集时间，然后计算收集的业务处理结果比率，如果达到熔断比率就进行熔断。代码如下：

image

运行效果如下：

image

2.3 回退(Fallback)

代码实现如下：

image

运行结果：

image

当异常发生的时候，也可以指定对应的操作逻辑。

2.4 超时(Timeout )

代码实现：

image

运行结果：

image

超时这分为乐观超时(Optimistic timeout)和悲观超时(Pessimistic timeout)，乐观超时需要CancellationToken 在业务逻辑中进行取消，而悲观超时没有取消的话，超时了还会继续执行，上面的案例就显示了，当触发超时之后，业务逻辑等待一段时间之后，还会返回结果，这个过程是需要耗费相关性能的；根据需要可以自行选择。乐观超时就不演示了，和正常线程逻辑一样，通过CancellationToken取消即可。

超时策略的最终目的就是考虑到用户体验，及时给用户反馈，不让用户一直处于等待中~~~~