1、Web Service与企业级分布式服务
Web Service 曾经是企业应用系统开发领域最时髦的词汇之一,用以整合异构系统及构建分布式系统。Web Service原理架构如下图所示:

服务提供者通过WSDL(Web Services Description Language,Web 服务器描述语言)向注册中心(Service Broker)描述自身提供的服务接口属性,注册中心使用UDDI(Universal Description, Discovery, and Integration,统一描述、发现和集成)发布服务提供者提供的服务,服务请求者从注册中心检索到服务信息后,通过SOAP(Simple Object Access Protocol,简单对象访问协议)和服务提供者通信,使用相关服务。
Web Service虽然有成熟的技术规范和产品实现,并在企业应用领域有许多成功的案例,但也有如下固有的缺点:
(一)臃肿的注册与发现机制。
(二)低效的XML序列化手段。
(三)开销相对较高的HTTP远程通信。
(四)复杂的部署与维护手段。
这些问题导致Web Service难以满足大型网站对系统高性能、高可用、易部署、易维护的要求。
2、大型网站分布式服务的需求与特点
对于大型网站,除了Web Service所提供的服务注册与发现,服务调用等标准功能,还需要分布式服务架构能够支持如下特性。
负载均衡
对于热门服务,比如登录服务或者商品服务,访问量非常大,服务需要部署在一个集群上。分布式服务架构要能够支持服务请求者使用可配置的负载均衡算法访问服务,使服务提供者集群实现负载均衡。
失效转移
可复用的服务通常会被多个应用调用,一旦该服务不可用,就会影响到很多应用的可用性。因此对于大型网站的分布式服务而言,即使是很少访问的简单服务,也需要集群部署,分布式服务框架支持服务提供者的失效转移机制,当某个服务实例不可用,就将访问切换到其他服务实例上,以实现服务整体高可用。
高效的远程通信
对于大型网站,核心服务每天的调用次数会达到数以亿计,如果没有高效的远程通信手段,服务调用会成为整个系统性能的瓶颈。
整合异构系统
由于历史发展和组织分割,网站服务可能会使用不同的语言开发并部署于不同的平台,分布式服务架构需要整合这些异构的系统。
对应用最少侵入
网站技术是为业务服务的,是否使用分布式服务需要根据业务发展规划,分布式服务也需要渐进式的演化,甚至会出现反复,即使用了分布式服务后又退回到集中式部署,分布式服务框架需要支持这种渐进式演化和反复。当然服务模块本身需要支持可集中式部署,也可分布式部署。
版本管理
为了应对快速变化的需求,服务升级不可避免,如果仅仅是服务内部实现逻辑升级,那么这种升级对服务请求者而言是透明的,无需关注。但如果服务的访问接口也发生了变化,就需要服务请求者和服务提供者同时升级才不会导致服务调用失败。企业应用系统可以申请停机维护,同时升级接口。但是网站服务不可能中断,因此分布式服务框架需要支持服务多版本发布,服务提供者先升级接口发布新版本的服务,并同时提供旧版本的服务供请求者调用,当请求者调用接口升级后才可以关闭旧版本服务。
实时监控
对于网站应用而言,没有监控的服务是不可能实现高可用的。分布式服务框架还需要监控服务提供者和调用者的各项指标,提供运维和运营支持。
3、分布式服务架构设计
大型网站需要更简单更高效的分布式服务框架建其SOA(Service Oriented Architecture 面向服务的体系架构)。据称Facebook利用Thrift(一个开源的远程服务调用框架)管理其分布式服务,服务的注册、发现及调用都通过Thrift完成,但对于一个大型网站可以使用的分布式服务框架,仅有Thrift还远远不够,遗憾的是,Facebook没有开源其基于Thrift的分布式服务框架。目前国内有较多成功实施案例的开源分布式服务框架是阿里巴巴的Dubbo。
我们以阿里爸爸分布式开源框架Dubbo为例,分析其架构设计,如下图所示:

服务消费者程序通过服务接口使用服务,而服务接口通过代理加载具体服务,具体服务可以是本地的代码模块,也可以是远程的服务,因此对应用较少侵入:应用程序只需要调用服务接口,服务框架根据配置自动调用本地或远程实现。
服务框架客户端模块通过服务注册中心加载服务提供者列表(服务提供者启动后自动想服务注册中心注册自己可提供的服务接口列表),查找需要的服务接口,并提供配置的负载均衡策略将服务调用请求发送到某台服务提供者服务器。如果服务调用失败客户端模块会自动从服务提供者列表选择一个可提供同样服务的另一台服务器重新请求服务,实现服务的自动失效转移,保证服务高可用。
Dubbo的远程服务通信模块支持多种通信协议和数据序列化协议,使用NIO通信框架,具有较高的网络通信性能。
网友评论