客服系统mesos/marathon迁移到DC/OS的探索(2)

作者: 运维小兵_加油 | 来源:发表于2017-07-16 11:12 被阅读0次

客服系统mesos/marathon迁移到DC/OS的探索(2)
客服系统mesos/marathon迁移到DC/OS的探索(1)
深入解析DC/OS 1.8 – 高可靠的微服务及大数据管理平台
Fabric8操作Kubernetes（一）
docker mesos编排（二）：marathon-lb介入
设置Marathon开机自启动
ubuntu14.04构建mesos-marathon集群
运维故障记录-failover of marathon not
基于容器云发布
kubernetes 对比 mesos + marathon

Mr-Redis 的github 地址是https://github.com/mesos/mr-redis，是华为基于mesos开发的一个redis framework, 方便管理redis实例和集群

Mr-Redis特点

充分使用数据中心的资源, 通过dashboard统一管理
创建一个redis实例的时间为秒级
failover的时间为秒级

(这个沙箱测试时把redis容器stop, 几秒种内会自动启动，不过ip和端口会发生变化，但节点redis数据会丢失，一主多从的模式数据不会丢失)

客服系统中的试用场景

redis当作cache使用

在微服务场景中，每个微服务单独一个实例，redis吞吐量小但实例多的场景
有的微服务把redis当作db使用，这种情况下redis必须是持久化和高可用的
和sentinel相比MrRedis的高可用方案更简单

部署架构

mr-redis.png

通过MrRedis创建Redis实例(单实例，或者一主多从)
redis实例信息存储在zk中
每个mesos上的服务通过本地的proxy (HAProxy or go-proxy)代理redis请求到真正的redis实例

为了使 go-proxy自动从zk读取redis实例的更新信息，对原来的go-proxy添加了几个功能

去掉config.json这个依赖, 初始化还有同步操作都从zk中读取
确保redis的本地proxy转发端口对所有mesos agent的唯一性 (利用zk实现的)
- 最开始考虑的做法是想根据redis name hash成一个固定并且唯一的在6100 - 6300区间的一个端口号，不过这种方式可能冲突几率比较大
- 本地proxy每次启动的时候都去zk读取本地监听的端口号 (eg: 6166)
- 新建redis,随机选取6100 ~ 6300 之间的一个端口号并且在zk里不存在，然后存到zk里
采用轮询方式

之前准备用zk的watch机制来及时更新内存中map里的redis实例信息，不过go实现的curator里的ChildrenCache没有实现，而TreeCache并不适合MrRedis的zk数据结构，所有就采用最简单的轮询方式了

reference: https://github.com/zousheng/mr-redis

目前沙箱测试情况

手动stop redis实例容器后2秒中，redis会自动发生failover, 通过localhost访问proxy没有任何影响, 对客户端是透明的，高可用是可以保证的
sched 模块重启后 dashbord里的信息都不在了，重启过程中没有从zk中重新获取一次，必须显示的逐个获取每个redis子节点信息后，dashbaorad才会显示，bug已经记录在https://github.com/mesos/mr-redis/issues/68 中了。

临时解决方案: 在marathon的sched task中，把health check改为command模式，这样定期获取zk中redis实例信息，这样重启sched就可以获取到所有的redis 信息了。

Note:

    最开始我是把获取zk redis的shell命令放到启动sched的命令后面，
    e.g. 
    work=/data/app/go_projects/src/github.com/mesos/mr-
    redis/sched
    cd $work && ./sched -config='config.json'     
     redis_instances=`curl -s  127.0.0.1:7979/Get/|jq .[].Name |tr -d '"'`;  
     if  [ -n "$redis_instances" ]; then    for redis in `echo 
    $redis_instances`;  do  curl  localhost:5656/v1/STATUS/${redis} ;  
    done; fi
    sched 启动命令后面， 但是这么做
    是不生效的，因为服务启动后就变成阻塞的了，后面的命令不会被
    执行到。突然想到health check中的command模式可以解决这个问
    题，把health check的tcp模式改为COMMAND模式，命令行为
    redis_instances=`curl -s  127.0.0.1:7979/Get/|jq .[].Name |tr -d '"'`;          
    if  [ -n "$redis_instances" ]; then    
        for redis in `echo  $redis_instances`; 
        do  
             curl  localhost:5656/v1/STATUS/${redis} ; 
        done;
    fi
     这样配置后每次重启sched，dashboard中的数据就不会丢失了。

总结：

目前MrRedis的使用者还很少，相关资料也很少，很多坑都需要自己摸索。期间参考了张开涛涛哥公众号里介绍的JIMDB设计和实现，使我意识到MrRedis还有很多重要的特性没有支持，比如在线全自动弹性伸缩，部分复制扩容，缩短扩容时间等等。所以MrRedis目前看只能算一个半成品，下阶段我们会努力尝试完善这部分功能。

JIMDB参考地址: https://mp.weixin.qq.com/s?__biz=MzIwODA4NjMwNA==&mid=2652898152&idx=1&sn=fa733a62f5de68cde2f3ec60591603f8&chksm=8cdcd727bbab5e31426d57c5dfe264875363b62e7e04b075ef6217b07778d7c7d5424579c020&mpshare=1&scene=23&srcid=0703mXCO4sYWtnXMGQ9TqfwI#rd