SOFA 源码分析 — 预热权重

作者: 莫那一鲁道 | 来源:发表于2018-05-04 00:13 被阅读45次

SOFA 源码分析 — 预热权重
SOFA 源码分析 —— 服务引用过程
SOFA 源码分析 — 调用方式
SOFA 源码分析— 事件总线
SOFA 源码分析 — 扩展机制
Soul源码阅读 sofa【第十七天】
SOFA 源码分析 — 自动故障剔除
SOFA 源码分析 — 泛化调用
SOFA 源码分析 —— 服务发布过程
SOFA源码学习

前言

SOFA-RPC 支持根据权重对服务进行预热功能，具体地址：预热权重.

引用官方文档：

预热权重功能让客户端机器能够根据服务端的相应权重进行流量的分发。该功能也常被用于集群内少数机器的启动场景。利用流量权重功能在短时间内对服务端机器进行预热，然后再接收正常的流量比重。运行机制如下：

1.服务端服务在启动时会将自身的预热时间，预热期内权重，预热完成后的正常权重推送给服务注册中心。如上图 ServiceB 指向 Service Registry 。

2.客户端在引用服务的时候会获得每个服务实例的预热权重信息。如上图 Service Registry 指向 client 。

3.客户端在进行调用的时候会根据服务所在地址的预热时期所对应的权重进行流量分发。如上图 client 指向 ServiceA 和 ServiceB 。 ServiceA 预热完毕，权重默认 100 ， ServiceB 处于预热期，权重为 10，因此所承受流量分别为 100%110 和 10%110 。

如何使用

该功能使用方式如下。

ProviderConfig<HelloWordService> providerConfig = new ProviderConfig<HelloWordService>() 
            .setWeight(100) 
            .setParameter(ProviderInfoAttrs.ATTR_WARMUP_WEIGHT,"10") 
            .setParameter(ProviderInfoAttrs.ATTR_WARM_UP_END_TIME,"12000");

如上，该服务的预热期为12s，在预热期内权重为10，预热期结束后的正常权重为100。如果该服务一共发布在两个机器A,B上，A机器正处于预热期内，并使用上述配置，B已经完成预热，正常权重为200。那么客户端在调用的时候，此时流量分发的比重为10：200，A机器预热结束后，流量分发比重为100：200。在SOFABoot中，如下配置预热时间，预热期间权重和预热完后的权重即可。

<sofa:reference id="sampleRestFacadeReferenceBolt" interface="com.alipay.sofa.endpoint.facade.SampleFacade">
    <sofa:binding.bolt>
         <sofa:global-attrs weight="100" warm-up-time="10000" warm-up-weight="1000"/>
     </sofa:binding.bolt>
</sofa:reference>

再来看看源码实现。

源码分析

从 demo 中看，SOFA 需要在 ProviderConfig 中配置属性，而这些属性都是保存在一个 Map 中。

代码：

 public S setParameter(String key, String value) {
        if (parameters == null) {
            parameters = new ConcurrentHashMap<String, String>();
        }
        if (value == null) {
            parameters.remove(key);
        } else {
            parameters.put(key, value);
        }
        return castThis();
    }

当发布服务的时候，这个 Map 会被发布到注册中心。具体代码如下：

    protected void doRegister(String appName, String serviceName, ProviderInfo providerInfo) {
        if (LOGGER.isInfoEnabled(appName)) {
            LOGGER.infoWithApp(appName, LogCodes.getLog(LogCodes.INFO_ROUTE_REGISTRY_PUB, serviceName));
        }
        //{service : [provider...]}
        ProviderGroup oldGroup = memoryCache.get(serviceName);
        if (oldGroup != null) { // 存在老的key
            oldGroup.add(providerInfo);
        } else { // 没有老的key，第一次加入
            List<ProviderInfo> news = new ArrayList<ProviderInfo>();
            news.add(providerInfo);
            memoryCache.put(serviceName, new ProviderGroup(news));
        }
        // 备份到文件 改为定时写
        needBackup = true;
        doWriteFile();

        if (subscribe) {
            notifyConsumerListeners(serviceName, memoryCache.get(serviceName));
        }
    }

上面的代码中，提供者会将 providerInfo 的信息写到本地文件(注册中心)中。

而消费者则会从注册中心订阅服务列表的信息。具体代码如下：

    @Override
    public List<ProviderGroup> subscribe(ConsumerConfig config) {
        String key = LocalRegistryHelper.buildListDataId(config, config.getProtocol());
        List<ConsumerConfig> listeners = notifyListeners.get(key);
        if (listeners == null) {
            listeners = new ArrayList<ConsumerConfig>();
            notifyListeners.put(key, listeners);
        }
        listeners.add(config);
        // 返回已经加载到内存的列表（可能不是最新的)
        ProviderGroup group = memoryCache.get(key);
        if (group == null) {
            group = new ProviderGroup();
            memoryCache.put(key, group);
        }
        return Collections.singletonList(group);
    }

上面这段代码会被 DefaultConsumerBootstrap 调用，根据消费者的配置信息，生成一个 key，然后将消费者添加到通知列表中（当数据变化时，通知消费者，由定时任务执行）。

然后，从内存中取出key 对应的服务分组，并返回集合（就是提供者注册的信息）。

这段代码会在 AbstractCluster 的 init 方法中调用—— List<ProviderGroup> all = consumerBootstrap.subscribe();。

服务分组的数据结构是 ProviderInfo，是一个抽象的服务提供列表，其中包含服务的信息，比如地址，协议类型，主机地址，端口，路径，版本，动态参数，静态参数，服务状态等等，其中就包括权重。

获取权重的方法如下：

public int getWeight() {
    ProviderStatus status = getStatus();
    if (status == ProviderStatus.WARMING_UP) {
        try {
            // 还处于预热时间中
            Integer warmUpWeight = (Integer) getDynamicAttr(ProviderInfoAttrs.ATTR_WARMUP_WEIGHT);
            if (warmUpWeight != null) {
                return warmUpWeight;
            }
        } catch (Exception e) {
            return weight;
        }
    }
    return weight;
}

注意 getStatus 方法：

public ProviderStatus getStatus() {
    if (status == ProviderStatus.WARMING_UP) {
        if (System.currentTimeMillis() > (Long) getDynamicAttr(ProviderInfoAttrs.ATTR_WARM_UP_END_TIME)) {
            // 如果已经过了预热时间，恢复为正常
            status = ProviderStatus.AVAILABLE;
            setDynamicAttr(ProviderInfoAttrs.ATTR_WARM_UP_END_TIME, null);
        }
    }
    return status;
}

逻辑如下：

获取服务状态，如果是预热状态，则获取预热状态的权重值，反之，如果不是，反之正常值（默认 100）。

获取状态的方法则是判断时间，如果当前时间大于预热时间，则修改状态为可用。并删除动态参数列表中的“预热时间”。

那么，什么时候会获取权重呢？

如果看过之前文章的同学肯定知道，在负载均衡的时候，会调用。

我们看看默认的随机均衡算法。还记得当时，楼主有个地方不是很明白，我们要根据权重随机，当时看来，并没有什么用处，今天明白了。再上一遍代码吧：

@ AbstractLoadBalancer.java
protected int getWeight(ProviderInfo providerInfo) {
    // 从provider中或得到相关权重,默认值100
    return providerInfo.getWeight() < 0 ? 0 : providerInfo.getWeight();
}

获取权重，默认 100.

再看随机算法的 doSelect 方法。

@ RandomLoadBalancer.java
@Override
public ProviderInfo doSelect(SofaRequest invocation, List<ProviderInfo> providerInfos) {
    ProviderInfo providerInfo = null;
    int size = providerInfos.size(); // 总个数
    int totalWeight = 0; // 总权重
    boolean isWeightSame = true; // 权重是否都一样
    for (int i = 0; i < size; i++) {
        int weight = getWeight(providerInfos.get(i));
        totalWeight += weight; // 累计总权重
        if (isWeightSame && i > 0 && weight != getWeight(providerInfos.get(i - 1))) {
            isWeightSame = false; // 计算所有权重是否一样
        }
    }
    if (totalWeight > 0 && !isWeightSame) {
        // 如果权重不相同且权重大于0则按总权重数随机
        int offset = random.nextInt(totalWeight);
        // 并确定随机值落在哪个片断上
        for (int i = 0; i < size; i++) {
            offset -= getWeight(providerInfos.get(i));
            if (offset < 0) {
                providerInfo = providerInfos.get(i);
                break;
            }
        }
    } else {
        // 如果权重相同或权重为0则均等随机
        providerInfo = providerInfos.get(random.nextInt(size));
    }
    return providerInfo;
}

首先判断各个服务的权重是否相同，如果不同，进入第二个 if。

关键点来了，如果权重不同，那么从总的权重中，随机一个数，一次从服务列表的权重递减。知道该值小于0，那么就使用该服务。

这样就能大致保证权重小的被击中的几率较小。具体取决于 Java 的随机算法，但是我们还是比较相信 Java 的。

我们来推倒一下这个算法。

假设有 A， B， C， 3 个服务，每个服务默认权重 100，其中 C 现在处于预热阶段，则 C 的权重等于 10.

那么总权重 210。

如果C落在第一位，那么一定会选中C的情况是权重落在0-9之间；
如果C落在第二位，那么一定会选中C的情况是权重落在100-109之间；
如果C是在第三位，那么一定会选中C的情况是权重落在200-209；

符合权重。

总结

现在看来，预热权重还是挺简单的，主要在负载均衡出进行处理就行。

今天就到这里，bye！！！

SOFA 源码分析 — 预热权重
前言 SOFA-RPC 支持根据权重对服务进行预热功能，具体地址：预热权重. 引用官方文档：预热权重功能让客户端...
SOFA 源码分析 —— 服务引用过程
前言在前面的 SOFA 源码分析 —— 服务发布过程文章中，我们分析了 SOFA 的服务发布过程，一个完整的...
SOFA 源码分析 — 调用方式
前言 SOFARPC 提供了多种调用方式满足不同的场景。例如，同步阻塞调用；异步 future 调用，Callb...
SOFA 源码分析— 事件总线
前言大部分框架都是事件订阅功能，即观察者模式，或者叫事件机制。通过订阅某个事件，当触发事件时，回调某个方法。该功...
SOFA 源码分析 — 扩展机制
前言我们在之前的文章中已经稍微了解过 SOFA 的扩展机制，我们也说过，一个好的框架，必然是易于扩展的。那么 S...
Soul源码阅读 sofa【第十七天】
sofa环境配置查看 Soul源码阅读体验sofa代理【第四天】[https://www.jianshu.com...
SOFA 源码分析 — 自动故障剔除
前言集群中通常一个服务有多个服务提供者。其中部分服务提供者可能由于网络，配置，长时间 fullgc ，线程池满，...
SOFA 源码分析 — 泛化调用
前言通常 RPC 调用需要客户端使用服务端提供的接口，而具体的形式则是使用 jar 包，通过引用 jar 包获取...
SOFA 源码分析 —— 服务发布过程
前言 SOFA 包含了 RPC 框架，底层通信框架是 bolt ，基于 Netty 4，今天将通过 SOFA—RP...
SOFA源码学习
这里源码主要学习服务的发布和引用为什么要有服务的发布和引用 Sofa中不同模块之间的spring context...

网友评论

鱼一样的享受:咨询一个问题，sofa和springcloud相比，有哪些优势的？感觉sofa想要做成一个生态，类似于springcloud的生态，可毕竟刚起步
莫那一鲁道:@鱼一样的享受 emmm，因为我不是 sofa 官方的，你这些问题我不能给出确切的答案，建议你去他们的 github 提 issue，他们回复还是很及时的
鱼一样的享受:@莫那一鲁道下面是在考虑公司框架选型时，我做的一些笔记，可否把相关顾虑给予一些释疑呢？
1. 现在的sofa基于springboot1.4.3，如果现在就基于sofa最新release版本搭建的话，后续如果升级springboot2.x的话，会要踩坑（sofa3.x是基于springboot2.x，可现在还是snapshot版本）
2. 类隔离特性上，由于公司代码已经进行了模块区分，做类隔离的意义好像不存在
3. 让我感觉有必要使用的，是sofaMesh，该功能能够把网络请求与业务代码给拆分开来，避免业务侧需要考虑网络上可能出现的问题，且网络层可独立升级，避免依赖业务侧的升级。可了解下serviceMesh。但是好像sofaMesh模块还并未开源出来
4. 在我理解中sofaRPC应该类似于dubbo，可以做服务治理，只不过这个需要运维介入了解下到底是否有需要，像类似于服务降级这种功能，是否需要。另外springcloud只有一个可监控的管理台，无法做到服务治理的功能
5. sofaboot包含一系列的中间件功能，例如微服务研发框架，RPC 框架，服务注册中心，分布式定时任务，限流/熔断框架，动态配置推送，分布式链路追踪，Metrics监控度量，分布式高可用消息队列，分布式事务框架，分布式数据库代理层等，这些功能是sofa官网所描述的中间件功能，在我看来，也都是可以基于springcloud上，引用业界通用的中间件插件的
6. 按照sofa所描述，该框架有开源版本和商业版本区分，虽说开源版本已经支持大部分功能，但是团队是否有足够的实力能够基于开源版本做公司级的定制化呢
莫那一鲁道:@鱼一样的享受嗯，SOFA 内部已经是一个 SpringCloud 的体系了，我觉得 SpringCloud 里面的一些东西并不一定适合在国内使用，比如我们公司最终还是把 SpringCloud 里面的基于 URL 的这套机制包装成了面向接口的机制。
另一方面 SOFA 会更加贴合国内的环境，里面包含了大量的蚂蚁的实践，比如模块化，类隔离之类的。后面我们开源的东西，也会补足 SpringCloud 在某些方面的不足，比如 Eureka。
IT人故事会:谢谢分享

SOFA 源码分析 — 预热权重

前言

如何使用

源码分析

总结

相关文章

SOFA 源码分析 — 预热权重

SOFA 源码分析 —— 服务引用过程

SOFA 源码分析 — 调用方式

SOFA 源码分析— 事件总线

SOFA 源码分析 — 扩展机制

Soul源码阅读 sofa【第十七天】

SOFA 源码分析 — 自动故障剔除

SOFA 源码分析 — 泛化调用

SOFA 源码分析 —— 服务发布过程

SOFA源码学习

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

SOFA