概述
Hystrix是一个用于处理分布式系统的延迟和容错的开元库,在分布式系统里,许多以来不可避免的会调用失败,比如超时,异常等,Hystrix能够保证在一个依赖出问题的情况下,不会导致整体服务失败,避免级联鼓掌,以提高分布式系统的弹性
"断路器"本身是一种开关装置,当某个服务单元发生故障之后,通过断路器的鼓掌监控(类似熔断保险丝),想调用方返回一个符合预期的,可处理的备选响应(FallBack),而不是长时间的等待或者跑出调用方无法处理的异常,这样就保证了服务调用方的线程不会被长时间,不必要的占用,从而避免了故障在分布式系统中的蔓延,乃至雪崩.
主要做的是
- 服务熔断
类似保险丝达到最大服务访问后,直接拒绝访问,拉闸限电,然后调用服务降级的方法并返回友好提示
- 服务降级
程序运行异常,超时,服务熔断出发服务降级,线程池/信号量打满也会导致服务降级.服务器忙,请稍后再试,不让客户端等待并立刻返回一个友好提示,fallback
- 服务限流
秒杀高并发等操作,严禁一窝蜂的过来拥挤,大家排队,一秒钟N个,有序进行
- 接近实时的监控
实操
构建
- 引入jar包
<dependency>
<groupId>org.springframework.cloud</groupId>
<artifactId>spring-cloud-starter-netflix-hystrix</artifactId>
</dependency>
高并发测试
在使用我们的jmeter200线程,200轮次的2w次请求同一耗时比较慢的接口时
public String paymentInfo_error(Integer id) {
try {
TimeUnit.SECONDS.sleep(3);
} catch (InterruptedException e) {
e.printStackTrace();
}
return "线程池" + Thread.currentThread().getName() + "\t" + id + "\t" + "^_^" + "耗时3秒钟";
}
这个时候,即使访问比较快的方法,也会受到拖累,因为tomcat默认200个线程,因为上述方法执行时,多数线程都被调用去拥挤到那儿去执行满方法,导致我们原本正常的服务也会被变慢
public String paymentInfo_OK(Integer id) {
return "线程池" + Thread.currentThread().getName() + "\t" + id + "\t" + "^_^";
}
hyxtrix如何解决
降级处理纬度
- 服务端down机,不能让客户端一直等待,必须有服务降级(选择较多)
- 对方服务执行成功,但时间大于我所期待的时间,自己做服务降级处理
- 服务端处理
在主启动类上加上开启配置注解
@EnableCircuitBreaker
在可能出错的业务类中添加服务降级fallback方法,并指定
/**
* @HystrixCommand 指定fallback降级方法
* @HystrixProperty 指定峰值等待时间
*/
@HystrixCommand(fallbackMethod = "paymentInfo_error_timeOutHandler", commandProperties = {
@HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds", value = "3000")})
public String paymentInfo_error(Integer id) {
try {
TimeUnit.SECONDS.sleep(5);
} catch (InterruptedException e) {
e.printStackTrace();
}
return "线程池" + Thread.currentThread().getName() + "\t" + id + "\t" + "^_^" + "耗时5秒钟";
}
public String paymentInfo_error_timeOutHandler(Integer id) {
return "线程池" + Thread.currentThread().getName() + "\t" + id + "\t" + "┭┮﹏┭┮" + "8001服务超时";
}
- 客户端处理(openFeign+hyxtrix)
主启动类加载开启配置注解
@EnableHystrix
yml配置文件开启hyxtrix
feign:
hystrix:
enabled: true
控制层添加fallback方法并指定
/**
* @HystrixCommand 指定fallback降级方法
* @HystrixProperty 指定峰值等待时间
*/
@GetMapping("error/{id}")
@HystrixCommand(fallbackMethod = "paymentInfo_error_timeOutHandler", commandProperties = {
@HystrixProperty(name = "execution.isolation.thread.timeoutInMilliseconds", value = "1000")})
public String error(@PathVariable("id") Integer id) {
return feignService.error(id);
}
public String paymentInfo_error_timeOutHandler(Integer id) {
return "线程池" + Thread.currentThread().getName() + "\t" + id + "\t" + "┭┮﹏┭┮" + "80服务超时";
}
全局服务降级配置
由于每个方法都要配置一个fallback,导致代码膨胀和麻烦,所以我们可以定义一个全局通用的服务降级处理,和自定义分开
- 再需要做服务降级的restControll上加上全局降级配置注解(defaultFallback参数为,类中的共享fallback方法名)
@DefaultProperties(defaultFallback = "payment_Global_FallbackMethod")
- 再需要做服务降级的方法上,加上服务降级处理,并不需要加参数,默认走我们的全局服务降级处理
@HystrixCommand
全局服务降级配置(二)
由于业务不同,需要考虑解耦性的情况下,对于一个服务调用接口,再不同的controller里都有用到,那么对每一个controller进行配置,也会增加耦合性,所以也有另一种方式来实现这种情况
- 针对于服务发现接口类去实现一个专门去配置fallback的类,并实现他们的接口方法
- 并在接口上的Fileclent注解上,指定这个class为,服务调用失败统一的fallback处理
@FeignClient(value = "CLOUD-PROVIDER-HYSTRIX-PAYMENT",fallback = FeignFallbackServiceImpl.class)
服务熔断
服务熔断类比保险丝达到最大服务访问后,直接拒绝访问,拉闸限电,然后调用服务降级的方法并返回友好提示
熔断机制是应对雪崩效应的一种微服务链路保护机制,当扇出链路的某个微服务出错不可用或者访问时间太长时间,会进行服务的降级,劲儿熔断该节点微服务的调用,快速返回错误的响应信息
在Spring Cloud框架里,熔断机制通过Hystrix实现,Hystrix会监控微服务之间的调用状况,当失败的调用到一定阈值,缺省是五秒内20次调用失败,就会启动熔断机制,熔断机制.当检测到该节点微服务调用响应正常后,恢复调用链路
实现
在需要服务熔断的接口上添加服务熔断注解
// =============服务熔断
@HystrixCommand(fallbackMethod = "paymentCircuitBreaker_fallback",commandProperties = {
@HystrixProperty(name = "circuitBreaker.enabled",value = "true"),//是否开启断路器
@HystrixProperty(name = "circuitBreaker.requestVolumeThreshold",value = "10"),//请求次数
@HystrixProperty(name = "circuitBreaker.sleepWindowInMilliseconds",value = "10000"),//时间范围
@HystrixProperty(name = "circuitBreaker.errorThresholdPercentage",value = "60")//失败率%达到多少后跳闸
})
public String paymentCircuitBreaker(Integer id) {
if (id < 0) {
throw new RuntimeException("id 不能负数");
}
return Thread.currentThread().getName() + "\t" + "调用成功,流水号: " + IdUtil.fastSimpleUUID();
}
其他配置可参考HystrixCommandProperties类,有详细参数
总结
服务熔断器是,当我们设定好的阈值达到了,便进行服务熔断的机制,再次重复调用直接返回fallback服务降级处理,根据内部算法慢慢的将服务进行恢复正常可调用状态
网友评论