对于一个互联网企业来说,公共服务包括数据中心、网络、服务器、计算、存储等。随着云计算的发展,"基础设施即服务(Infrastructure as a Service,IaaS)"正在将这些互联网基础设施变成全社会的基础设施。
云计算作为社会的基础设施,具有以下特点:
规模化
可获得性
先进性
构建统一的基础设施架构,整体数据中心从软件层面抽象为以下6个部分(从下到上):
整体数据中心核心技术分层平台层软件,包括固件、驱动、操作系统、虚拟化等。
资源管理,主要是统一资源调度系统。
硬件抽象层,例如统一的分布式文件系统。
部署和维护,例如微软的AutoPilot。
编程框架,例如MapReduce等。
应用层软件,例如搜索、数据库、机器学习等。
进一步细分,以阿里巴巴为例,将基础设置核心组件结合阿里巴巴的技术和业务现状,可以得到如下的技术分层:
基础技术:包含计算平台和数据平台。
调度平台:统一提供各种任务需求与计算,负责存储资源的协调和管理。
计算:包含计算硬件设备、操作系统和虚拟化软件及其提供的不同资源形态。
存储:包含存储硬件设备、分布式存储软件及其所提供的服务接口。
网络:包含交换机、网卡、线缆等设备及其运维管理和应用平台。
DC大脑:针对计算、存储、网络、数据中心、资源供应等整体的智能化运营和决策体系。
阿里巴巴基础设施的综合竞争力
结合阿里巴巴的业务特征,阿里首先可以在阿里巴巴特有的业务场景下实现基础设施的世界第一,例如在“双11”海量突发流量这一场景下,可以说阿里巴巴的技术已经是世界第一,那么在这一场景下的基础设施也应该成为世界第一,具体来说,像交易型DataBase(OLTP)、在离线混部、存储计算分离这些技术和场景叠加“双11”,结合基础设施在规模、性能、稳定性等方面的优势,阿里巴巴基础设施的综合竞争力必然成为这个领域的世界第一。
其次,业界新技术的出现也给后来者提供了弯道超车的机会,例如在异构计算、AI芯片等领域,结合应用场景,阿里巴巴的完全可以建立一套自主掌控的具有核心竞争力的基础设施技术体系。
最后,对于黑天鹅类技术的提前布局,让阿里巴巴有了在未来持续保持世界第一的可能性,例如,量子通信、量子计算、DNA存储/计算等。
基础设施5.0——AI、异构、智能化
2020年前后,阿里巴巴的基础架构全面演进到5.0版本,主要有有几个方面的突破:
大规模、高带宽网络集群:以5.1HAIL网络架构为基础,实现3~5万台大规模集群部署、存储计算分离架构、业务的混部。
在AI驱动下,异构计算(GPU、FPGA)成为基础设施重要的一部分。
信息化、数据化基本完成,智能化初步显露威力。
基础设施6.0——一体化最优基础设施架构
从2020年到2022年,基础设施6.0将引领阿里成为世界第一。这一阶段的典型特征如下:
基础设施架构稳定,从业务到宏观架构,再到微观架构的一体化优化,成为重点方向,追求极致性能与极致成本优化。
异构计算已经成为大部分业务的重要竞争力,例如结合阿里巴巴业务的深度自研芯片(智能网卡、NPU等)成为阿里巴巴在基础设施领域的核心竞争力。
架构上的创新成为驱动计算能力增长的源泉,例如,内存计算、网络随路计算、新型存储及内部池化技术等。
进入5G+时代,随着端上的处理能力及网络能力的极度增强并赋能新的应用场景(如新零售),近端的边缘计算与网络会成为新的技术竞争方向。
全面智能化时代,例如,无人值守的全智能化IDC、数据中心能耗使用的极致优化等。
网友评论