美文网首页Java实战技术开发者头条互联网技术栈
Hystrix实现分布式系统中的故障容错

Hystrix实现分布式系统中的故障容错

作者: JavaQ | 来源:发表于2017-07-23 12:17 被阅读1409次

    Hystrix是什么

    分布式服务系统通常会通过HTTP或RPC方式调用所依赖的服务,例如支付服务通过HTTP或RPC调用银行卡服务。在高并发请求的情景下,依赖的服务可能会出现服务异常、网络连接缓慢、资源繁忙、暂时不可用、服务脱机等情况,这些异常情况将会严重影响整个线上系统的稳定性和可用性,最糟糕的情况是产生服务雪崩效应。复杂的分布式服务系统往往会依赖更多的其它服务,在高并发的情况下,如果没有做好隔离措施,这些依赖将会拖垮整个服务调用者。Hystrix是Netflix的一个帮助解决分布式服务系统交互时超时处理和容错的类库,它具有降级和熔断的保护能力,可以优雅的解决上述问题。

    Hystrix能做什么

    Hystrix提供了如下功能特性:
    1.Hystrix把服务调用统称为依赖调用,Hystrix通过使用命令模式将依赖调用逻辑封装在HystrixCommand中,每一次的依赖调用将在Hystrix的单独线程池(或信号)中执行;
    2.可根据业务需要配置依赖分组名、线程池,使不同分组的依赖可以在不同的线程池中执行,隔离不同依赖调用的资源;
    3.可配置依赖调用超时时间(一般配置为比99.5%平均调用时间略高),当依赖调用超时时直接返回或执行getFallback方法;
    4.依赖调用异常、超时、短路时将执行getFallback方法;
    5.提供了熔断器(CircuitBreaker)机制,可根据设定的条件(如调用失败率大于50%)判断依赖调用是否可以继续被调用,如果某个依赖调用的错误百分比超过阈值,则通过手动或自动地中断一个熔断器,一段时间内依赖调用无法被执行;
    6.提供了对依赖调用的实时统计和监控。

    Hystrix如何使用

    1.添加Hystrix依赖

    <dependency> 
         <groupId>com.netflix.hystrix</groupId> 
         <artifactId>hystrix-core</artifactId> 
         <version>1.5.12</version> 
    </dependency>
    

    2.使用HystrixCommand封装依赖调用
    通过继承HystrixCommand封装依赖调用,示例代码如下:

    public class CommandHelloWorld extends HystrixCommand<String> {
    
        private final String name;
    
        public CommandHelloWorld(String name) {
            super(HystrixCommandGroupKey.Factory.asKey("HelloWorldGroup"));
            this.name = name;
        }
    
        @Override
        protected String run() throws Exception {
            // 在这里调用依赖
            Thread.sleep(500L);
            return "Hello " + name + "--" + Thread.currentThread().getId();
        }
    
        // 超时、异常后执行该方法
        @Override
        protected String getFallback() {
            return "fallback";
        }
    }
    

    run方法:run方法体中进行依赖调用
    getFallback方法:当run方法中依赖调用超时、异常(除了HystrixBadRequestException)时会执行getFallback方法快速返回;当run方法中的依赖调用在设置的时间内超时、异常(除了HystrixBadRequestException)的频率超过阈值,后续对这个依赖的调用将直接执行getFallback方法,待冷却一段时间后,对这个依赖的调用会重新进入run方法执行。

    3.执行封装的依赖调用
    3.1同步执行
    调用execute方法即为同步执行,当前线程将一直阻塞,直到获取结果,示例代码如下:

        @Test
        public void testSynchronous() {
            CommandHelloWorld commandHelloWorld = new CommandHelloWorld("jack");
            System.out.print(commandHelloWorld.execute() + "--" + Thread.currentThread().getId());
        }
    

    输出结果如下:

        Hello jack--16--1
    

    从输出结果可以看到依赖调用线程和主线程不是同一个,实现了线程隔离。

    HystrixCommand默认的调用超时时间是1000毫秒,如果将上述run方法中的线程休眠时间改成1100毫秒,再次运行testSynchronous单元测试,将得到如下结果:

        fallback--1
    

    可以看到在依赖调用时间超过设置的默认超时时间时,将执行getFallback方法快速返回,实现优雅降级,其过程如下图所示。

    getFallback.png

    3.2异步执行
    调用queue方法即为异步执行,不阻塞当前线程,返回一个Future对象,示例代码如下:

        @Test
        public void testAsynchronous() throws Exception {
            CommandHelloWorld commandHelloWorld = new CommandHelloWorld("jack");
            Future<String> future = commandHelloWorld.queue();
            System.out.println(future.get() + "--" + Thread.currentThread().getId());
        }
    

    输出结果如下:

        Hello jack--16--1
    

    queue().get()等同于同步调用execute()

    3.3热注册观察者执行
    调用observe方法即为热注册观察者执行,返回一个Observable对象,当run方法执行完成后,进入观察者订阅的事件中,示例代码如下:

        @Test
        public void testHotObservable() throws Exception {
            CommandHelloWorld commandHelloWorld = new CommandHelloWorld("jack");
            Observable<String> ho = commandHelloWorld.observe();
            //订阅结果回调事件
            ho.subscribe(new Action1<String>() {
                public void call(String result) {
                    //result为run方法执行返回的结果
                    System.out.println(result + "--" + Thread.currentThread().getId());
                }
            });
            Thread.sleep(1000);
    
            //订阅一个完整的回调事件
            ho.subscribe(new Subscriber<String>() {
                //在onNext执行后执行
                public void onCompleted() {
                    System.out.println("oonCompleted ");
                }
    
                //在run/onNext方法执行异常后执行
                public void onError(Throwable throwable) {
    
                }
    
                //在run方法返回结果后执行
                public void onNext(String s) {
                    System.out.println("onNext: " + s );
                }
            });
        }
    

    输出结果如下:

        Hello jack--16--16
        onNext: Hello jack--16
        oonCompleted
    

    3.4冷注册观察者执行
    调用toObservable方法即为冷注册观察者执行,同样返回Observable对象,但它是在注册的时即执行run方法,示例代码如下:

        @Test
        public void testColdObservable() throws Exception {
            CommandHelloWorld commandHelloWorld = new CommandHelloWorld("jack");
            Observable<String> ho = commandHelloWorld.toObservable();
            ho.subscribe(new Action1<String>() {
                public void call(String s) {
                    System.out.println(s + "--" + Thread.currentThread().getId());
                }
            });
            Thread.sleep(1000);
        }
    

    输出结果如下:

        Hello jack--16--16
    

    前面三种调用方式,最终都是依赖toObservable方式,这其中的转换如下图所示:

    hystrix-return-flow.png

    属性配置

    查看HystrixCommand源码,可以发现一个常用的构造方法HystrixCommand(HystrixCommand.Setter setter),使用方法如下:

            HystrixCommandGroupKey groupKey = HystrixCommandGroupKey.Factory.asKey("HelloWorld");
            HystrixCommandKey commandKey = HystrixCommandKey.Factory.asKey("hello");
            HystrixThreadPoolKey threadPoolKey = HystrixThreadPoolKey.Factory.asKey("hello");
            HystrixCommand.Setter setter = HystrixCommand.Setter
                    .withGroupKey(groupKey)
                    .andCommandKey(commandKey)
                    .andThreadPoolKey(threadPoolKey);
    
            HystrixCommand<String> helloCommand = new HystrixCommand<String>(setter) {
    
                protected String run() throws Exception {
                    //依赖调用
                    return "run";
                }
    
                @Override
                protected String getFallback() {
                    //fail back
                    return super.getFallback();
                }
            };
    

    这个HystrixCommand.Setter中包含了如下属性:

            protected final HystrixCommandGroupKey groupKey;
            protected HystrixCommandKey commandKey;
            protected HystrixThreadPoolKey threadPoolKey;
            protected com.netflix.hystrix.HystrixCommandProperties.Setter commandPropertiesDefaults;
            protected com.netflix.hystrix.HystrixThreadPoolProperties.Setter threadPoolPropertiesDefaults;
    

    1 HystrixCommandKey
    Hystrix使用单例模式存储HystrixCommand,熔断机制就是根据单实例上的调用情况统计实现的,所以每个HystrixCommand要有自己的名字,用于区分,同时用于依赖调用的隔离。HystrixCommandKey就是用于定义这个名字,如果没有定义这个名字,Hystrix会使用其类名作为其名字,可以使用HystrixCommandKey.Factory.asKey(String name)方法定义一个名称。

    2 HystrixThreadPoolKey
    HystrixThreadPoolKey是HystrixCommand所在的线程池,如果该参数不设置则使用HystrixCommandGroupKey作为HystrixThreadPoolKey,这种情况下同一个HystrixCommandGroupKey下的依赖调用共用同一个线程池内,如果不想共用同一个线程池,则需要设置该参数。可以使用HystrixThreadPoolKey.Factory.asKey(String name)方法设置。

    3 HystrixCommandGroupKey
    Hystrix需要对HystrixCommand进行分组,便于统计、管理,所以需要一个分组名称,HystrixCommandGroupKey就是用于定义分组名称,可以使用HystrixCommandGroupKey.Factory.asKey(String name)方法定义一个分组名。每个HystrixCommand必须要配置一个分组名,一个是用于分组,还有如果没有配置HystrixThreadPoolKey,这个分组名将会用于线程池名。

    4 HystrixThreadPoolProperties
    从名称上可以看出这是线程池的属性配置,可以通过它设置核心线程数大小、最大线程数、任务队列大小等,当然它也又一些默认的配置参数。

    5 HystrixCommandProperties
    这个就是HystrixCommand的属性配置,它可以设置熔断器是否可用、熔断器熔断的错误百分比、依赖调用超时时间等,它有一些默认的配置参数,如熔断器熔断的错误百分比默认值是50%、依赖调用超时时间默认值是1000毫秒。

    隔离方式

    Hystrix支持线程隔离和信号量隔离:

    线程隔离

    不同的依赖调用分配到不同的线程池中执行,使用线程对依赖调用进行隔离,上述的示例代码就是使用线程隔离。优点是隔离性能好,可设置短路机制(依赖调用失败后执行getFallback()或依赖调用熔断后,一段时间内对该依赖的调用将直接返回失败),缺点是涉及到线程切换的性能损耗,但是官方给出的结果是性能损耗是可以接受的。

    信号量隔离

    信号量隔离可实现对依赖调用最高并发请求数的限制,每次依赖调用都会先判断信号量是否达到阈值,如果达到极限值则拒绝调用,优点是不用新启线程,缺点是每次都需要获取信号量,使用方式如下:

        HystrixCommandGroupKey groupKey = HystrixCommandGroupKey.Factory.asKey("HelloWorld");
            HystrixCommandKey commandKey = HystrixCommandKey.Factory.asKey("hello");
            HystrixThreadPoolKey threadPoolKey = HystrixThreadPoolKey.Factory.asKey("hello");
            //配置信号量隔离
            HystrixCommandProperties.Setter commandPropertiesSetter = HystrixCommandProperties.Setter().withExecutionIsolationStrategy(HystrixCommandProperties.ExecutionIsolationStrategy.SEMAPHORE);
            HystrixCommand.Setter setter = HystrixCommand.Setter
                    .withGroupKey(groupKey)
                    .andCommandKey(commandKey)
                    .andThreadPoolKey(threadPoolKey)
                    .andCommandPropertiesDefaults(commandPropertiesSetter);
    

    Hystrix工作过程

    工程过程如下图所示:

    hystrix-command-flow-chart.png

    步骤描述如下:
    1.使用HystrixCommand或HystrixObservableCommand封装一个依赖调用;
    2.执行封装的依赖调用;
    3.判断本次调用是否可以从缓存中取结果,如果可以,直接返回缓存的结果;如果不可以进入第4步判断;
    4.判断熔断器是否打开,如果打开则进入第8步;如果没打开则进入第5步;
    5.判断信号量或线程池是否已满,如果已满则进入第8步;如果没满则进入第6步;
    6.执行依赖调用,调用失败或超时进入第8步;调用成功返回结果;
    7.根据依赖调用成功、失败或超时计算熔断值;
    8.getFallback()执行失败或没实现getFallback()方法,将抛出异常;getFallback()执行成功返回fallback值。

    Hystrix熔断保护机制

    Hystrix熔断保护就像电路中的熔断器一样,在电压过高时,保险丝会熔断,防止火灾,做到用电安全。熔断保护机制的工作过程如下图所示:

    circuit-breaker-1280.png

    熔断器工作过程如下:
    1.假设大量的请求数量超过了HystrixCommandProperties.circuitBreakerRequestVolumeThreshold()的阈值,并且依赖调用失败的百分比超过了HystrixCommandProperties.circuitBreakerErrorThresholdPercentage()的阈值,熔断器将会从关闭状态变成打开状态;
    2.在熔断器处于打开状态的期间,所有对这个依赖进行的调用都会短路,即不进行真正的依赖调用,返回失败;
    3.在等待(冷却)的时间超过HystrixCommandProperties.circuitBreakerSleepWindowInMilliseconds()的值后,熔断器将处于半开的状态,将允许单个请求去调用依赖,如果这次的依赖调用还是失败,熔断器状态将再次变成打开,这个打开状态持续时间是HystrixCommandProperties.circuitBreakerSleepWindowInMilliseconds()配置的值;如果这次的依赖调用成功,熔断器状态将变成关闭,后续依赖调用可正常执行。

    依赖调用监控

    Hystrix提供了Hystrix Dashboard功能,可以实时监控依赖的调用情况。

    相关文章

      网友评论

      • JavaQ:关注微信公众号JavaQ,获取最新文章

      本文标题:Hystrix实现分布式系统中的故障容错

      本文链接:https://www.haomeiwen.com/subject/fntmkxtx.html