作为新一代微服务架构体系,Service Mesh技术有效地解决了Spring Cloud微服务架构和服务治理过程中的痛点问题,一经推出便引起了很大的反响。近一年来,伴随着云原生的热火朝天,Service Mesh被推向了巅峰,从陌生走向大家的视界,甚至一些初创企业都想从中获得第一桶金。对于初创企业或全新产品,选择Service Mesh变得相对轻松很多,毕竟不存在迁移的问题。但对于大部分企业或成熟的产品体系,这样大的架构转型就变得很难以实施,需要多加权衡利弊,面对Service Mesh带来的好处,不得不迫使向它靠拢。
目前很多企业还是采用基于SDK的传统微服务框架(例如,Dubbo、Spring Cloud)进行服务治理,而随着Service Mesh的普及,越来越多的企业开始布局自己的Service Mesh框架体系,但多数企业刚开始不会激进地将所有业务迁移至Serivice Mesh,毕竟这样风险太大、收益太慢。像 Java 技术栈应用依然保留原框架,而非 Java 技术栈应用采用Service Mesh框架,不同开发语言可以用不同的技术框架,但业务不能被框架割裂,那么在这两种架构体系下应用服务如何互联互通?微服务如何统一治理?传统微服务又如何平滑迁移至Service Mesh呢?
1、背景
微服务是近些年来软件架构中的热名词,也是一个很大的概念,不同人对它的理解都各不相同,甚至在早期微服务架构中出现了一批四不像的微服务架构产品,有人把单纯引入Spring Boot、Spring Cloud框架也叫做微服务架构,却只是将它作为服务的 Web 容器而已。
随着微服务的火热,越来越多的团队开始实践,将微服务纷纷落地,并投入生产。但随着微服务规模的不断壮大,每增加一个微服务,就可能会增加一些依赖的基础设施和第三方的配置,比如Kafka实例等,相应CI/CD的配置也会增加或调整。 同时随着微服务数量增多、业务复杂性的提升及需求的多样性等(如,对接第三方异构系统等),服务间通信的错综复杂,一步步地将微服务变得更加臃肿,服务治理也是难上加难,而这些问题在单体架构中很容易解决。为此,有人开始怀疑当初微服务化是否是明智之选,甚至考虑回归到传统单体应用。
正如下图所示,PPT 中的微服务总是美好的,但现实中的微服务却是一团糟糕,想甩甩不掉,越看越糟心。难道就没有办法了么?
1.1 传统微服务架构面临的挑战
面对上述暴露出的问题,并在传统微服务架构下,经过实践的不断冲击,面临了更多新的挑战,综上所述,产生这些问题的原因有以下这几点:
过于绑定特定技术栈。当面对异构系统时,需要花费大量精力来进行代码的改造,不同异构系统可能面临不同的改造。
代码侵入度过高。开发者往往需要花费大量的精力来考虑如何与框架或SDK结合,并在业务中更好的深度融合,对于大部分开发者而言都是一个高曲线的学习过程。
多语言支持受限。微服务提倡不同组件可以使用最适合它的语言开发,但是在Spring Cloud框架下就是 Java 的天下,多语言的支持难度很大。这也就导致在面对异构系统对接时的无奈,或退而求其次的方案了。
老旧系统维护难。面对老旧系统,很难做到统一维护、治理、监控等,在过度时期往往需要多个团队分而管之,维护难度加大。
上述这些问题都是在所难免,我们都知道技术演进来源于实践中不断的摸索,将功能抽象、解耦、封装、服务化。随着传统微服务架构暴露出的这些问题,将迎来新的挑战,让大家纷纷寻找其他解决方案。
1.2 迎来新一代微服务架构
为了解决传统微服务面临的问题,以应对全新的挑战,微服务架构也进一步演化,最终催生了Service Mesh的出现,迎来了新一代微服务架构,也被称为下一代微服务。为了更好地理解Service Mesh的概念和存在的意义,我们来回顾一下这一演进过程。
1.2.1 耦合阶段
在微服务架构中,服务发现、熔断、治理等能力是微服务架构重要的组成部分。微服务化之后,服务更加的分散,复杂度变得更高,起初开发者将诸如熔断、超时等功能和业务代码封装在一起,使服务具备了网络控制能力,如下图所示。
这种方案虽然易于实现,但从设计角度来讲却存在一定的缺陷。
基础设施功能(如,服务发现,负载均衡、熔断等)和业务逻辑高度耦合。
每个微服务都重复实现了相同功能的代码。
管理困难。如果某个服务的负载均衡发生变化,则调用它的相关服务都需要更新变化。
开发者不能集中精力只关注于业务逻辑开发。
1.2.2 公共库 SDK
基于上面存在的问题,很容易会想到将基础设施功能设计为一个公共库 SDK,让服务的业务逻辑与这些功能降低耦合度,提高重复利用率,更重要的是开发者只需要关注公共库 SDK 的依赖及使用,而不必关注实现这些公共功能,从而更加专注于业务逻辑的开发,比如Spring Cloud框架是类似的方式。如下图所示:
实际上即便如此,它仍然有一些不足之处。
这些公共库 SDK 存在较为陡峭的学习成本,需要耗费开发人员一定的时间和人力与现有系统集成,甚至需要考虑修改现有代码进行整合。
这些公共库 SDK 一般都是通过特定语言实现,缺乏多语言的支持,在对现有系统整合时有一定的局限性。
公共库 SDK 的管理和维护依然需要耗费开发者的大量精力,并需专门人员来进行管理维护。
1.2.3 Sidecar 模式
有了上面公共库 SDK 的启发,加上跨语言问题、更新后的发布和维护等问题,人们发现更好的解决方案是把它作为一个代理,服务通过这个透明的代理完成所有流量的控制。
这就是典型的Sidecar代理模式,也被翻译为边车代理,它作为与其他服务通信的桥梁,为服务提供额外的网络特性,并与服务独立部署,对服务零侵入,更不会受限于服务的开发语言和技术栈,如下图所示。
以Sidecar模式进行通信代理,实现了基础实施层与业务逻辑的完全隔离,在部署、升级时带来了便利,做到了真正的基础设施层与业务逻辑层的彻底解耦。另一方面,Sidecar可以更加快速地为应用服务提供更灵活的扩展,而不需要应用服务的大量改造。Sidecar可以实现以下主要功能:
服务注册。帮助服务注册到相应的服务注册中心,并对服务做相关的健康检查。
服务路由。当应用服务调用其它服务时,Sidecar可以帮助从服务发现中找到相应的服务地址,完成服务路由功能。
服务治理。Sidecar可以完全拦截服务进出的流量,并对其进行相应的调用链跟踪、熔断、降级、日志监控等操作,将服务治理功能集中在Sidecar中实现。
集中管控。整个微服务架构体系下的所有服务完全可以通过Sidecar来进行集中管控,完成对服务的流控、下线等。
于是,应用服务终于可以做到跨语言开发、并更专注于业务逻辑的开发。
1.2.4 Service Mesh
把Sidecar模式充分应用于一个庞大的微服务架构系统,为每个应用服务配套部署一个Sidecar代理,完成服务间复杂的通信,最终就会得到一个如下所示的网络拓扑结构,这就是Service Mesh,又称之为“服务网格“。
至此,迎来了新一代微服务架构——Service Mesh,它彻底解决了传统微服务架构所面临的问题。
1.3 什么是 Service Mesh
在开始进入主题之前,我认为有必要再对Service Mesh进行统一的阐述,这样将有助于理解它,更加便于阅读接下来的内容。
1.3.1 Service Mesh 介绍
Service Mesh翻译为“服务网格”,作为服务间通信的基础设施层。轻量级高性能网络代理,提供安全的、快速的、可靠地服务间通讯,与实际应用部署一起,但对应用透明。应用作为服务的发起方,只需要用最简单的方式将请求发送给本地的服务网格代理,然后网格代理会进行后续的操作,如服务发现,负载均衡,最后将请求转发给目标服务。
Service Mesh目的是解决系统架构微服务化后的服务间通信和治理问题。服务网格由Sidecar节点组成,这个模式的精髓在于实现了数据面(业务逻辑)和控制面的解耦。具体到微服务架构中,即给每一个微服务实例同步部署一个Sidecar。
在Service Mesh部署网络结构图中,绿色方块为应用服务,蓝色方块为SideCar,应用服务之间通过Sidecar进行通信,整个服务通信形成图中的蓝色网络连线,图中所有蓝色部分就形成了Service Mesh。其具备如下主要特点:
应用程序间通讯的中间层。
轻量级网络代理。
应用程序无感知。
解耦应用程序的重试/超时、监控、追踪和服务发现。
Service Mesh的出现解决了传统微服务框架中的痛点,使得开发人员专注于业务本身,同时,将服务通信及相关管控功能从业务中分离到基础设施层。
1.3.2 Service Mesh 的功能
那么Service Mesh到底能够做什么呢?
Service Mesh作为微服务架构中负责网络通信的基础设施层,具备网络处理的大部分功能。下面列举了一些主要的功能:
动态路由。可通过路由规则来动态路由到所请求的服务,便于不同环境、不同版本等的动态路由调整。
故障注入。通过引入故障来模拟网络传输中的问题(如延迟)来验证系统的健壮性,方便完成系统的各类故障测试。
熔断。通过服务降级来终止潜在的关联性错误。
安全。在Service Mesh上实现安全机制(如TLS),并且很容易在基础设施层完成安全机制更新。
多语言支持。作为独立运行且对业务透明的Sidecar代理,Service Mesh很轻松地支持多语言的异构系统。
多协议支持。同多语言一样,也支持多协议。
指标和分布式链路追踪。
概括起来,Service Mesh主要体现在以下 4 个方面:
可见性:运行时指标遥测、分布式跟踪。
可管理性:服务发现、负载均衡、运行时动态路由等。
健壮性:超时、重试、熔断等弹性能力。
安全性:服务间访问控制、TLS加密通信。
1.3.3 Service Mesh 解决什么问题
从上述Service Mesh的介绍和功能来看:
基础设施层是Service Mesh的定位,致力于解决微服务基础设施标准化、配置化、服务化和产品化的问题。
服务间通信是Service Mesh技术层面对的问题,对微服务屏蔽通信的复杂度,解决微服务的通信治理问题。
请求的可靠传递是Service Mesh的目标。
轻量级网络代理是Service Mesh的部署方式。
对应用程序透明是Service Mesh的亮点和特色,实现对业务无侵入。
综合上述,Service Mesh主要解决用户如下 3 个维度的痛点需求:
完善的微服务基础设施
通过将微服务通信下沉到基础设施层,屏蔽了微服务处理各种通信问题的复杂度,形成微服务之间的抽象协议层。开发者无需关心通信层的具体实现,也无需关注RPC通信(包含服务发现、负载均衡、流量调度、流量降级、监控统计等)的一切细节,真正像本地调用一样使用微服务,通信相关的一起工作直接交给Service Mesh。
语言无关的通信和链路治理
功能上,Service Mesh并没有提供任何新的特性和能力,Service Mesh提供的所有通信和服务治理能力在Service Mesh之前的技术中均能找到,比如Spring Cloud就实现了完善的微服务RPC通信和服务治理支持。
Service Mesh改变的是通信和服务治理能力提供的方式,通过将这些能力实现从各语言业务实现中解耦,下沉到基础设施层面,以一种更加通用和标准化的方式提供,屏蔽不同语言、不同平台的差异性,有利于通信和服务治理能力的迭代和创新,使得业务实现更加方便。
Service Mesh避免了多语言服务治理上的重复建设,通过Service Mesh语言无关的通信和服务治理能力,助力于多语言技术栈的效率提升。
通信和服务治理的标准化
微服务治理层面,Service Mesh是标准化、体系化、无侵入的分布式治理平台。
标准化方面,Sidecar成为所有微服务流量通信的约束标准,同时Service Mesh的数据平台和控制平面也通过标准协议进行交互。
体系化方面,从全局考虑,提供多维度立体的微服务可观测能力(Metric、Trace、Logging),并提供体系化的服务治理能力,如限流、熔断、安全、灰度等。
通过标准化,带来一致的服务治理体验,减少多业务之间由于服务治理标准不一致带来的沟通和转换成本,提升全局服务治理的效率
网友评论