雪崩效应
- 如果服务提供者响应非常缓慢,则消费者的请求会进入强制等待,直到响应或超时,在高负荷情况下,如果不做处理,则会导致消费者的系统资源耗尽而崩溃。
- 微服务架构的应用系统通常包含多个服务层,微服务之间通过网络进行通信,服务之间难免存在依赖关系,任何微服务并非 100% 可用,网络有时会发生故障
- 我们把 “基础服务故障” 导致 “级联故障” 的现象称之为雪崩效应,基础服务的故障会导致其它服务发生故障,而服务与服务之间相互依赖,从而发生系统崩溃
雪崩效应
雪崩效应
容错机制
- 通过容错机制来防止雪崩效应,主要实现以下两点:
-
为网络请求设置超时
- 正常情况下远程调用在几十毫秒内就能得到响应,若依赖的服务网络发生故障,则响应会变得很长 。
- 一次远程调用对应着一个线程/进程,若响应太慢,线程/进程就得不到释放,而它又对应着系统资源,若得不到释放会导致系统崩溃
-
使用断路器模式
- 如果对某个微服务的请求又大量超时(常常说明该微服务不可用),再让新的请求去访问该微服务已没有意义。例如设置超时时间 1 秒,如果短时间内有大量请求无法在 1 秒内得到响应,就没有必要去请求该微服务了
- 断路器可自动诊断依赖服务是否已恢复正常,若恢复正常则恢复请求该微服务,从而实现微服务的 “自我修复” ,当微服务不正常时断路器快速失败,从而防止雪崩效应,当发现微服务恢复正常时,重新恢复请求
- 断路器状态的逻辑为:
- 正常情况下,断路器关闭,可正常请求依赖的服务
- 当一段时间内,请求失败率达到一定值(如错误率达到50%,或100次/分钟等),断路器就会打开,此时不会再去请求依赖服务
- 断路器打开一段时间后,会进入 “半开”状态,此时断路器允许一个请求访问依赖服务,如果请求成功则关闭断路器,否则继续打开
容错机制
Hystrix
- Hystrix 是开源的延迟和容错库,用于隔离访问远程系统、防止级联失败,从而提升系统的的可用性与容错性
-
Hystrix 特点:
- 包裹请求:使用 HystrixCommand 包裹对依赖的调用逻辑,每个命令在独立线程中执行
- 跳闸机制:当某服务错误率超过一值时,Hystrix 可以自动或手动跳闸,停止请求该服务一段时间
- 资源隔离:Hystrix 为每个依赖库都维护了一个小型线程池,如果该线程池已满,发现该依赖的请求就会被立即拒绝,而不是排队等候
- 监控:Hystrix 可以几乎实时的监控运行指标和配置变化,例如成功、超时、失败、以及被拒绝的请求等
- 回退机制:当请求失败、超时、被拒绝,或当断路器打开时,执行回退逻辑,回退逻辑可以由开发人员提供
- 自我修复:断路器打开一段时间后,会进入 “半开” 状态,断路器打开、关闭、半开的逻辑转换
快速入门
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-hystrix</artifactId>
</dependency>
- 在启动类上添加注解 @EnableCircuitBreaker 或 @EnableHystrix,启动断路器支持
- 修改 MovieController,让其中的 findById 方法具备容错能力,下面代码为 findById 方法编写了一个回退方法 findByIdFallBack,该方法与 findById 方法具有相同的参数与返回值类型,该方法返回了一个默认的 UserEntity,在 findById 方法上,使用注解 @HystrixCommand 的 fallbackMethod 属性指定回退方法是 findByIdFallback
@RestController
public class MovieController {
@Autowired
private RestTemplate restTemplate;
@HystrixCommand(fallbackMethod = "findByIdFallback")
@GetMapping("/user/{id}")
public UserEntity findById(@PathVariable int id) {
return this.restTemplate.getForObject("http://FILM-USER/" + id, UserEntity.class);
}
public UserEntity findByIdFallback(int id) {
UserEntity user = new UserEntity();
user.setId(-1);
user.setName("默认用户");
return user;
}
}
- HystrixCommand 配置非常灵活,可以使用注解 @HystrixProperty 的 commandProperties 属性来配置 @HystrixCommand,如:
@HystrixCommand(fallbackMethod = "findByIdFallback",commandProperties = {
@HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds",value = "5000"),
@HystrixProperty(name = "metrics.rollingStats.timeInMilliseconds",value = "10000")
},threadPoolProperties = {
@HystrixProperty(name="coreSize",value = "1"),
@HystrixProperty(name="maxQueueSize",value = "10")
})
@GetMapping("/user/{id}")
public User findById(@PathVariable int id){
//...
}
- 测试:
{"id":1,"username":"account1","name":"张三","age":20,"balance":100.00}
{"id":-1,"username":null,"name":"默认用户","age":0,"balance":null}
Hystrix 断路器的状态
{"status":"UP","hystrix":{"status":"UP"}}
"hystrix":{"status":"CIRCUIT_OPEN"
Hystrix 线程隔离策略
- Hystrix 的隔离策略有两种
-
THREAD(线程隔离):使用该方式,HystrixCommand 将会在单独的线程上执行,并发请求受到线程池中的线程数量限制
-
SEMAPHORE(信号量隔离):使用该方式,HystrixCommand 将会在调用线程上执行,开销相对较小,并发请求受到信号量个数限制
- Hystrix 推荐使用 THREAD(默认),因为这种方式有一个除网络超时以外的额外保护层
- 只有当负载非常高时(例如每个实例调用数百次)才需要使用信号量隔离,因为这种情况下使用 THREAD 开销比较高,信号量隔离一般仅适用于非网络调用的隔离
- 可以在注解中让 Hystrix 使用不同的隔离策略
@HystrixCommand(fallbackMethod = "findByIdFallback",commandProperties = {
@HystrixProperty(name = "execution.isolation.strategy", value = "SEMAPHORE")
})
Feign 整合 Hystrix
- 前文使用 @HystrixCommand 的 fallbackMethod 属性实现回退,然而 Feign 是以接口形式工作,它没有方法体,前文讲解的方式显然不适用于 Feign,Spring Cloud 默认已为 Feign 整合 Hystrix,只要 Hystrix 在项目 classpath 中,Feign 默认就会用断路器包裹所有方法
- 使用 @FeignClient 的 fallback 属性指定回退类
@FeignClient(name = "FILM-USER",fallback = UserFeignClientFallBack.class)
public interface UserFeignClient {
@GetMapping("/{id}")
UserEntity findById(@PathVariable("id") int id);
}
/**
* 回退类 FeignClientFallback 需实现 FeignClient 接口
*/
public class UserFeignClientFallBack implements UserFeignClient {
@Override
public UserEntity findById(int id) {
UserEntity user = new UserEntity();
user.setId(-1);
user.setUsername("默认用户");
return user;
}
}
使用 FallbackFactory 捕获回退异常
- 通过 FallbackFactory 可捕获回退异常,可根据不同的异常返回不同的回退结果
public class UserFeignClientFallbackFactory implements FallbackFactory<UserFeignClient> {
private static final Logger LOGGER = LoggerFactory.getLogger(UserFeignClientFallbackFactory.class);
@Override
public UserFeignClient create(Throwable throwable) {
return new UserFeignClient() {
@Override
public UserEntity findById(int id) {
UserFeignClientFallbackFactory.LOGGER.info("fallback;reason was:",throwable);
UserEntity user = new UserEntity();
user.setId(-1);
user.setUsername("默认用户");
return user;
}
};
}
}
为 Feign 禁用 Hystrix
- 默认情况下 Spring Cloud 会包裹 Feign 客户端的所有方法,但某些场景下不需要该功能,可借助 Feign 的自定义配置,为指定名称的 Feign 客户端禁用 Hystrix
@Configuration
public class FeignDisableHystrixConfiguration {
@Bean
@Scope("prototype")
public Feign.Builder feignBuilder(){
return Feign.builder();
}
}
- 想要禁用 Hystrix 的 @FeginClient 引用该配置类即可
@FeignClient(name = "FILM-USER",fallback = FeignDisableHystrixConfiguration.class)
public interface UserFeignClient {
//...
}
- 也可以在配置文件中配置下面属性,Feign 全局禁用 Hystrix
feign.hystrix.enabled = false
Hystrix 监控
- Hystrix 还提供了近乎实时的监控,HystrixCommand 和 HystrixObservableCommand 在执行时会生成执行结果和运行指标,比如每秒请求数、成功数等,这些监控数据对分析应用系统状态很有用
- 使用 Hystrix 的模块 hystrix-metrics-event-stream 就可以将监控信息以 text/event-stream 格式暴露给外部系统
- spring-cloud-starter-hystrix 已经包含该模块,在此基础上只需添加 spring-boot-starter-actuator,就可以使用 /hystrix.stream 端点获得 Hystrix 的监控信息
- 访问 http://localhost:8010/hystrix.stream 后可看见浏览器一直处于请求状态,页面空白,这是因为 @HystrixCommand 的方法还没有被执行
- 访问 http://localhost:8010/user/1 后再次访问 http://localhost:8010/hystrix.stream 可看到页面会出现监控数据,包括错误率、错误数、断路器状态等
- 若要监控 Feign 的 Hystrix,需要在启动类上添加 @EnableCircuitBreaker
使用 Hystrix Dashboard 可视化监控数据
- 创建新项目,并添加 Hystrix Dashboard 库,在启动类上添加 @EnableHystrixDashboard
<dependency>
<groupId>org.springframework.boot</groupId>
<artifactId>spring-boot-starter-hystrix-dashboard</artifactId>
</dependency>
server:
port:8030
Hystrix Dashboard
Hystrix Dashboard
使用 Turbine 聚合监控数据
- 前文中使用 /hystrix.stream 端点监控单个微服务实例,但一个微服务架构的应用程序系统会包含若干个微服务,每个微服务通常会部署多个实例,通过 Turbine 能将所有相关 /hystrix.stream 端点的数据聚合到一个组合的 /turbine.stream 中,从而让集群监控更加方便
Turbine
- 创建一个项目,添加 Turbine 依赖,在启动类上添加 @EnableTurbine 注解
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-turbine</artifactId>
</dependency>
server:
port: 8031
spring:
application:
name: turbine
eureka:
client:
service-url:
defaultZone: http://localhost:8761/eureka/
instance:
prefer-ip-address: true
turbine:
appConfig: flim-consumer1,flim-consumer2
clusterNameExpression: "'default'"
Turbine
网友评论