spring cloud 降级和熔断的区别与说明

作者: virtual灬zzZ | 来源:发表于2021-10-30 00:07 被阅读0次

spring cloud 降级和熔断的区别与说明
spring-cloud限流降级熔断
2022-06-30 Springcloud基础知识（7）- S
微服务集成hystrix
2022-07-22 Springcloud基础知识（14）-
Spring Cloud 熔断降级
Spring Cloud Alibaba：Sentinel实现熔
hystrix入门-原生API使用
.NET Core + Spring Cloud：熔断降级
Dubbo之降级Mock源码分析

服务熔断

服务熔断的作用类似于我们家用的保险丝，当某服务出现不可用或响应超时的情况时，为了防止整个系统出现雪崩，暂时停止对该服务的调用。

服务降级

服务降级是从整个系统的负荷情况出发和考虑的，对某些负荷会比较高的情况，为了预防某些功能（业务场景）出现负荷过载或者响应慢的情况，在其内部暂时舍弃对一些非核心的接口和数据的请求，而直接返回一个提前准备好的fallback（退路）错误处理信息。这样，虽然提供的是一个有损的服务，但却保证了整个系统的稳定性和可用性。

熔断VS降级

相同点：

目标一致都是从可用性和可靠性出发，为了防止系统崩溃；

用户体验类似最终都让用户体验到的是某些功能暂时不可用；

不同点：

触发原因不同服务熔断一般是某个服务（下游服务）故障引起，而服务降级一般是从整体负荷考虑；

以上是比较普遍的说法。

编码注意点

hystrix日常使用一般都是集成feign使用，我们需要在配置文件中打开hystrix，默认是关闭

feign:
  hystrix:
    enabled: true

使用circuitBreaker，加上注解 @EnableHystrix 或者 @EnableCircuitBreaker ，前者实际包含了后者了。

@Target({ElementType.TYPE})
@Retention(RetentionPolicy.RUNTIME)
@Documented
@Inherited
@EnableCircuitBreaker
public @interface EnableHystrix {
}

理解总结

降级，使用hystrix注解，其实hystrix组件里头已经包含了CircuitBreaker熔断器。

降级是调用了服务方的，而熔断是不再调用任何东西，直接给返回结果。

展开熔断说明：

该图是熔断的三种状态：关闭、半开、全开。

Closed：熔断器关闭状态，调用失败次数积累，到了阈值（或一定比例）则启动熔断机制；
Open：熔断器打开状态，此时对下游的调用都内部直接返回错误，不走网络，但设计了一个时钟选项，默认的时钟达到了一定时间（这个时间一般设置成平均故障处理时间，也就是MTTR），到了这个时间，进入半熔断状态；
Half-Open：半熔断状态，允许定量的服务请求，如果调用都成功（或一定比例）则认为恢复了，关闭熔断器，否则认为还没好，又回到熔断器打开状态；

断路器的三个重要参数：快照时间窗、请求总数下限、错误百分比下限。这个参数的作用分别是：

快照时间窗：断路器确定是否打开需要统计一些请求和错误数据，而统计的时间范围就是快照时间窗，默认为最近的10秒。
请求总数下限：在快照时间窗内，必须满足请求总数下限才有资格根据熔断。默认为20，意味着在10秒内，如果该hystrix命令的调用此时不足20次，即时所有的请求都超时或其他原因失败，断路器都不会打开。
错误百分比下限：当请求总数在快照时间窗内超过了下限，比如发生了30次调用，如果在这30次调用中，有16次发生了超时异常，也就是超过50%的错误百分比，在默认设定50%下限情况下，这时候就会将断路器打开。

那么当断路器打开之后会发生什么呢？我们先来说说断路器未打开之前，对于之前那个示例的情况就是每个请求都会在当hystrix超时之后返回fallback，每个请求时间延迟就是近似hystrix的超时时间，如果设置为5秒，那么每个请求就都要延迟5秒才会返回。当熔断器在10秒内发现请求总数超过20，并且错误百分比超过50%，这个时候熔断器打开。打开之后，再有请求调用的时候，将不会调用主逻辑，而是直接调用降级逻辑，这个时候就不会等待5秒之后才返回fallback。通过断路器，实现了自动地发现错误并将降级逻辑切换为主逻辑，减少响应延迟的效果。

在断路器打开之后，处理逻辑并没有结束，我们的降级逻辑已经被成了主逻辑，那么原来的主逻辑要如何恢复呢？对于这一问题，hystrix也为我们实现了自动恢复功能。当断路器打开，对主逻辑进行熔断之后，hystrix会启动一个休眠时间窗，在这个时间窗内，降级逻辑是临时的成为主逻辑，当休眠时间窗到期，断路器将进入半开状态，释放一次请求到原来的主逻辑上，如果此次请求正常返回，那么断路器将继续闭合，主逻辑恢复，如果这次请求依然有问题，断路器继续进入打开状态，休眠时间窗重新计时。

Circuit Breaker参数（可以在application文件配置）

由于Hystrix是一个容错框架，因此我们在使用的时候，要达到熔断的目的只需配置一些参数就可以了。但我们要达到真正的效果，就必须要了解这些参数。Circuit Breaker一共包括如下6个参数。

circuitBreaker.enabled
是否启用熔断器，默认是TURE。
circuitBreaker.forceOpen
熔断器强制打开，始终保持打开状态。默认值FLASE。
circuitBreaker.forceClosed
熔断器强制关闭，始终保持关闭状态。默认值FLASE。
circuitBreaker.errorThresholdPercentage
设定错误百分比，默认值50%，例如一段时间（10s）内有100个请求，其中有55个超时或者异常返回了，那么这段时间内的错误百分比是55%，大于了默认值50%，这种情况下触发熔断器-打开。
circuitBreaker.requestVolumeThreshold
默认值20.意思是至少有20个请求才进行errorThresholdPercentage错误百分比计算。比如一段时间（10s）内有19个请求全部失败了。错误百分比是100%，但熔断器不会打开，因为requestVolumeThreshold的值是20. 这个参数非常重要，熔断器是否打开首先要满足这个条件，
circuitBreaker.sleepWindowInMilliseconds
半开试探休眠时间，默认值5000ms。当熔断器开启一段时间之后比如5000ms，会尝试放过去一部分流量进行试探，确定依赖服务是否恢复。

以上的10s 即 metrics.rollingStats.timeInMilliseconds 的设置值(默认是10s)

#参考官方配置 https://docs.spring.io/spring-cloud-openfeign/docs/2.2.5.RELEASE/reference/html/
feign:
  client:
    config:
      default:
        connectTimeout: 1000
        readTimeout: 5000
  hystrix:
    enabled: true

hystrix:
  command:
    default:
      execution:
        isolation:
          thread:
            timeoutInMilliseconds: 10000 # 设置hystrix的超时时间为6000ms
      circuitBreaker:
        #在当10秒的时间内，最近20次调用请求，请求错误率超过50%，则触发熔断5秒，期间快速失败，以下都是默认值
        requestVolumeThreshold: 20
        errorThresholdPercentage: 50
        sleepWindowInMilliseconds: 5000
      #设置统计的时间窗口值的毫秒值，circuit break 的打开会根据1个rolling window的统计来计算。
      #若rolling window被设为10000毫秒，则rolling window会被分成n个buckets，
      #每个bucket包含success，failure，timeout，rejection的次数的统计信息。默认10000。
      metrics:
          rollingStats:
            timeInMilliseconds: 10000

注意：关于hystrix在application.properties配置是没提示的，但是HystrixCommandProperties是会获取的。hystrix的参数写法可以按照参考处链接按层级关系写。