美文网首页@IT·互联网技匠志
基于SpringBoot的微服务架构与K8S容器部署实践(精简版

基于SpringBoot的微服务架构与K8S容器部署实践(精简版

作者: 技匠 | 来源:发表于2021-02-04 10:14 被阅读0次

    前不久作为架构师完成了某知名快消企业的一个业务中台建设。系统上线后,经历了双十一活动的流量高峰,整体运行稳定。最近有空,便将此次架构的思路,心得稍作整理在这篇博客中分享一下。不会深入每一个技术细节,而是把用到的技术、框架、工具做一个简单的回顾,作为日后的参考。

    业务架构

    业务架构方面,该系统作为业务中台,主要负责客户资产管理,包括客户的卡、券以及其他虚拟资产。通过对外暴露标准restful接口的方式提供服务。服务的调用方包括自有渠道的app、小程序,以及合作伙伴渠道,包括招行、阿里等。而系统本身也会通过服务网关去调用公司内部的其他业务系统接口,如通过客户中心接口同步会员信息等。


    根据目前的统计,这个业务中台,每日的服务调用量在700万次左右,有活动时也会超过1000万次。而大部分交易,发生在上班、午休以及下午3点左右(下午茶)的时间段内。


    由于涉及到客户业务细节,这里对业务架构就不做详细说明了。

    技术架构

    这个案例中采用了基于SpringBoot的微服务架构。结合企业自身的基础架构设施,进行K8S容器化部署,并采用Kong API Gateway对各业务中台暴露的API接口进行统一管理。

    Kong API Gateway

    随着微服务架构在企业中的流行,原来大而全的系统被拆分为粒度较小的中台,而系统中的大部分功能则被以restful API形式提供的服务所取代,这使得IT系统能够更加快速地响应业务变化带来的挑战,但同时随着服务的增加,如何有效管理这些服务却成为难题。


    在一些中小型项目中,我们一般都会采用Spring Cloud的技术栈,并选择Spring Cloud Gateway来作服务网关。然而,对于一些大型企业,则需要全局考虑服务的治理,网关性能,以及其他扩展功能。

    在这个案例中,企业使用了Kong作为API网关。中台将需要开放外部使用的API,通过网关控制台进行注册,添加证书,生成Auth Key供关联方使用。

    Kong具有以下一些特性,能够很好地满足大型组织对于服务网关的需求:

    • 开源(本案例中使用的是Kong的企业版,提供了原厂服务)
    • 亚毫秒级的响应延迟,得益于基于Nginx与OpenResty带来的超高性能
    • 单节点25K TPS
    • 认证、授权、限流、数据转换(此案例中会员ID被添加到请求头中)、日志、统计分析


    应用架构

    整个系统采用java开发后端以及vue开发前端,应用部分共分为4个服务组件,全部进行容器化部署,并通过Ingress Controller负载均衡对外暴露服务:

    • 资产服务:提供客户资产相关的服务接口
    • 资产消费者服务:MQ监听服务,异步处理资产相关请求
    • 控制台服务:资产管理运维类服务接口,供控制台前端使用
    • 控制台前端服务:使用Vue开发的控制台前端应用(如下图)


    SpringBoot

    除控制台前端外,其他三个组件均采用目前主流的java微服务框架SpringBoot 2.3.4开发(考虑到稳定性,未使用最新的2.4版本)。

    本案例中,通过开发应用框架,实现了系统中数据表达形式的统一,以及标准的据转换、校验、消息绑定、错误处理等功能。架构师需要对应用框架负责,简明、高效、统一的应用框架,能够提升开发效率,产出标准一致的代码,保证交付质量。

    应用框架不在本文的讨论范围内,而以下一些技巧或第三方包,却在我们构建大多数SpringBoot应用中得到使用。

    定制MyBatis

    数据层框架采用MyBatis,在大型应用中MyBatis能够帮助程序员更好地控制数据层交互,并进行调优。一般可以在applicaion.yml中配置MyBatis,但当我们需要让MyBatis支持更多定制特性(如:多数据库支持)时,可以通过定义SqlSessionFactory bean来实现。

        @Bean
        public SqlSessionFactory sqlSessionFactory(DataSource dataSource) throws Exception {
            SqlSessionFactoryBean sfb = new SqlSessionFactoryBean();
            sfb.setDataSource(dataSource);
            sfb.setVfs(SpringBootVFS.class);
            Properties props = new Properties();
            props.setProperty("dialect", dataConfiguration.getDialect());
            props.setProperty("reasonable", String.valueOf(dataConfiguration.isPageReasonable()));
            PageHelper pagePlugin = new PageHelper();
            pagePlugin.setProperties(props);
            Interceptor[] plugins = {pagePlugin};
            sfb.setPlugins(plugins);
    
            ResourcePatternResolver resolver = new PathMatchingResourcePatternResolver();
    
            sfb.setMapperLocations(resolver.getResources("classpath*:mappers/"+ dataConfiguration.getDialect()+"/*.xml"));
            sfb.setTypeAliasesPackage("com.xxx.bl.core.data.model");
    
            SqlSessionFactory factory = sfb.getObject();
            factory.getConfiguration().setMapUnderscoreToCamelCase(true);
    //        factory.getConfiguration().addInterceptor(new CoreResultSetHandler());
            factory.getConfiguration().setCallSettersOnNulls(dataConfiguration.isCallSettersOnNulls());
            return factory;
        }
    

    使用logback日志组件

    采用logback日志框架,可以在logback配置文件中指定针对不同的Spring profile在不同的环境中采用不同的日志级别,并采用不同的appender。同时引入spring-cloud-starter-sleuth依赖,通过设置traceId,使整个请求全链路上的所有日志打印出一致的traceId,大大方便了各系统间生产问题的协同排查。另外,采用异步方式记录日志,也有利于降低IO阻塞。

       <springProfile name="stg">
            <root level="error">
                <appender-ref ref="STDOUT"/>
                <appender-ref ref="SAVE-ERROR-TO-FILE-STG"/>
            </root>
            <logger name="org.xxx" level="error" additivity="false">
                <appender-ref ref="STDOUT"/>
                <appender-ref ref="ASYNC-SAVE-TO-FILE-STG"/>
            </logger>        
        </springProfile>
        <springProfile name="prod">
            <root level="error">
                <appender-ref ref="STDOUT"/>
                <appender-ref ref="SAVE-ERROR-TO-FILE-PROD"/>
            </root>
            <logger name="org.xxx" level="error" additivity="false">
                <appender-ref ref="ASYNC-SAVE-TO-FILE-PROD"/>
            </logger>
        </springProfile>
    

    SSL加密及密码安全

    全链路传输加密已成为企业安全中必不可少的措施。通过在classpath中引入CA颁发(也可以使用自签)的jks证书,并在application配置文件中进行简单配置,便可实现SpringBoot应用的SSL加密。

      ssl:
        enabled: true
        key-store: classpath:xxx.net.jks
        key-store-type: JKS
        key-store-password: RUIEIoUD
        key-password: RUIEIoUD
        require-ssl: true
    

    密码以明文形式存放在配置文件中,也是不安全的。你可以jasypt加密配置文件中使用到的密码,或者直接使用Key-Vault方案,比如本案例中会分别在微软云环境中使用Azure Key Vault或本地IDC中使用Cyberark Conjur方案。

    同步与异步服务

    我们并没有使用Spring Webflux来支持reactive特性,因为,这会增加开发复杂度,并且Webflux虽然改善了Web容器阻塞机制,但并不能从根本上解决高并发请求到来时的阻塞问题。

    在这个案例中,通过搭建了3个节点的RabbitMq镜像集群,作为消息中间件,并通过应用框架的支持,实现了服务的同步异步切换功能。我们将对外提供的服务注册到数据库中,在应用启动时,读入redis缓存。当请求到来时,通过API code判断该请求的响应模式:同步或异步。如果是同步请求则直接处理,而如果是异步请求,则发送到RabbitMq中,再由经过封装的消费者组件进行异步消费,最终达到削峰的目的。


    对于开发人员来说,他们只需要关注服务的业务逻辑开发,由应用框架统一处理服务的同步,异步切换,消息发送或失败时的异常处理,以及死信队列的维护等工作。

    Dockerfile

    案例中的四个组件需要实现容器化部署,分别为SpringBoot应用与Vue应用创建Dockerfile。

    典型的SpringBoot应用Dockerfile如下,一般情况下大型组织会构建私有镜像仓库,通过私有仓库拉取镜像的速度更快,能够节省CICD的时间。

    FROM openjdk:11-jre
    #FROM cargo.xxx.net/library/openjdk:11-jre
    ARG JAR_FILE=console-service/build/libs/*.jar
    COPY ${JAR_FILE} app.jar
    EXPOSE 9002
    EXPOSE 9003
    ENTRYPOINT [ "java", "-jar", "/app.jar" ]
    

    vue应用的Dockerfile如下,同样添加了SSL证书,进行传输加密:

    FROM cargo.xxx.net/library/nginx:stable-alpine
    COPY /dist /usr/share/nginx/html/console
    COPY nginx.conf /etc/nginx/nginx.conf
    ARG KEY_FILE=stg.xxx.net.key
    ARG PEM_FILE=stg.xxx.net.pem
    COPY ${KEY_FILE} /etc/ssl/certs/cert.key
    COPY ${PEM_FILE} /etc/ssl/certs/cert.pem
    EXPOSE 80
    CMD [ "nginx", "-c", "/etc/nginx/nginx.conf", "-g", "daemon off;" ]
    

    编写dockerfile时有以下一些注意事项:

    • 基础镜像:尽可能推荐选择官方镜像
    • 选择大小适中的版本:如果选择的基础镜像过大,启动后需要消耗更多的资源,影响系统性能。如果太小,则可能缺失关键功能。
    • 利用缓存:将dockerfile中不易变动的内容写在dockerfile最前。

    数据库架构

    在账户数据上亿,交易数据几百亿的系统,需要采用分库分表方案。本案例中,采用了MyCat+MySQL的数据库架构方案。采用mycat代理Master与Slave,可灵活进行主从切换。Slave可作为Master热备,也同时可作为读库,实现读写分离。备库除作为准实时的备份外,也可作为运维库或提供大数据平台数据抽取。

    同时采用1主2从1备的双机房设计

    • Master到Slave使用半同步方案,保证从库数据一致性。
    • Master异常时,通过mycat切换至Slave,Slave转换为新Master
    • Master异常恢复后,先将原Master设置为Slave,数据同步完成后,再切换回正式Master

    mycat高可用

    mycat采用k8s容器化运行,使用k8s service来实现mycat的负载均衡,达到mycat的集群的高可用。若mycat容器节点异常,应用自动连接到另外的mycat节点上。

    对数据库的大量操作是读操作,一般占到所有操作70%以上。所以做读写分离还是很有必要的,如果不做读写分离,那么从库也是一种很大的浪费。 mycat通过配置很容易做到读写分离,在从库进行读操作,提升资源利用率,在主库进行写操作,减低主库压力。


    分库分表

    • 垂直分库:按照功能划分,把数据分别放到不同的数据库和服务器。例如:账户、资产、交易等业务领域不同的数据分别放在不同的库中,分散压力、减少相互影响、降低耦合,独立模块独立发布
    • 水平分库:在垂直分库不能满足要求时,再对模型进行水平的 切分,将同一实体,不同范围的数据分散到不同库中,保持单库数量和压力,提升连接数,达到横向扩展的目的。


    冷热数据方案

    热数据缓存

    • 对于高频使用的热数据,如经常使用App的客户信息等,适当增加数据库query cache,提升数据库查询性能。
    • 在应用层使用redis等内存缓存部分高频使用数据,降低请求响应时间,增加系统流畅度,提升客户体验。
    • 进行读写分离,使用从库提供数据查询的服务,提升从库硬件资源利用率,降低主库读压力,增加主库写性能。提升整体效率。
    冷数据归档
    • 对于使用频率很低或基本不使用的冷数据,如历史交易、历史卡券等,进行数据的归档,提升数据库的性能。
    • 也可提供使用频率较低的历史交易查询功能,使用备库提供服务。
    • 对于交易类数据建议按日期进行分库分表,每日交易分为一片或多片,对于历史交易如1年前交易进行定期迁移和归档,提升数据库性能。

    DEVOPS与K8S容器化部署

    DEVOPS流水线

    本案例中,通过基于jenkins的CICD平台,将应用代码从github代码库获取,使用gradle进行构建(前端使用npm构建),通过dockerfile打成镜像后,部署到K8S容器平台。


    在进行持续集成的过程中,同时加入了安全检查,合规检查以及单元测试(SpringBoot应用使用JUnit,Vue前端应用使用Jest测试框架)的步骤,以保证每一次发布的质量。

    ConfigMap

    ConfigMap用于将应用的配置信息与程序的分离,这种方式不仅可以实现应用程序被的复用,而且还可以通过不同的配置实现更灵活的功能。本案例中,SpringBoot应用在K8S部署时,便将application.yml文件以ConfigMap文件的形式进行挂载。需要注意,SpringBoot会优先读取classpath下的配置文件,因此需要在打出springboot应用jar包时,先将配置文件排除,并通过容器启动命令参数来制定挂载的应用配置文件。

    -spring.profiles.active=prod
    -spring.config.location=/config/application.yml
    

    K8S容器部署

    在K8S部署平台,可以为每一个服务指定初始的资源,以及节点数量配置。比如我们为SpringBoot应用初始配置,2core 4g的资源配置,节点数量则为20个。


    根据需要我们可以采用滚动方式对pod数量进行伸缩。而不会引起服务不可用的情况。


    另外,我们也可以利用弹性伸缩,基于某些关键指标,如容器的CPU使用量作为阈值,来触发容器进行弹性伸缩。在这个案例中,通过弹性伸缩机制,在上班以及中午业务高峰时间段内,将更多pod提供给业务服务组件,而在晚上,则会将pod从业务组件收回,提供给需要跑批处理以及异步消费的服务组件。

    运维与监控

    ELK

    ELK是一套解决方案而不是一款软件, 三个字母分别是三个软件产品的缩写。 E代表Elasticsearch,负责日志的存储和检索; L代表Logstash, 负责日志的收集,过滤和格式化;K代表Kibana,负责日志的展示统计和数据可视化。


    Dynatrace

    Dynatrace可能是目前最优秀的应用性能管理工具(APM),它既能监控基础设施如服务器,K8S容器,又能自动发现并监控在容器内运行的动态微服务,了解它们如何执行、相互之间如何通信,还能立即检测出性能不佳的微服务。在我们的案例中,通过定制dashboard添加我们所需要关注的监控数据。

    Dynatrace还能自动识别服务,并提供更精细的检测数据,为开发或运维人员定位问题,带来了极大的帮助。


    一些思考

    • 数据库分库分表方案带来的代码侵入问题:MyCat+MySQL虽然在物理上实现了分库分表,但对于开发来说带来了侵入性问题,需要为分片键进行特殊的表结构设计,在进行查询时也需要额外考虑分片键的使用,以提升查询效率。其他的如事务的处理,由于分库的关系,我们不再依赖事务,而是通过数据最终一致性,以及错误补偿等方式进行处理。
    • 未来数据库的选型:MyCat+MySQL给数据库运维增加了复杂性,而未来针对超大数据量级的应用,在硬件资源允许的情况下,可以考虑转向如:TiDB这样的NewSQL方案进行替代。
    • JVM优化:应用上线后,在高并发情况下曾偶发Long GC问题,通过分析dump文件,优化内存使用,进行了解决。另外,对于内存变化较大的应用,也可以考虑使用jdk13,并开启ZGC。
    • 案例中通过redis缓存服务配置信息,每次服务响应时都需要读取redis,这给redis造成了不小的压力,通过引入Guava cache,在本地建立缓存副本,并设定合理的失效时间,能够显著降低对redis的压力。
    • 通过应用框架实现低代码:在应用框架上的投资是非常值得的,通过将共性问题集中在应用框架中解决,可以在一定程度上实现低代码平台的特性。开发人员也能更专注于业务逻辑的实现。
    • 开发管理:通过让每位开发人员充分理解应用框架,并形成解决同类问题的统一Pattern,能够明显提高开发效率,减少低质量代码的产生。

    今天先记录到这里,随着实践的深入,相信后面还会有更多新的补充,也欢迎大家一起分享经验。

    相关文章

      网友评论

        本文标题:基于SpringBoot的微服务架构与K8S容器部署实践(精简版

        本文链接:https://www.haomeiwen.com/subject/ytavtltx.html