美文网首页云计算技术文章引用
阿里云、腾讯云挂了之后,我分析了这十家云巨头的SLA

阿里云、腾讯云挂了之后,我分析了这十家云巨头的SLA

作者: AIOPstack | 来源:发表于2018-12-26 16:46 被阅读8次

    阿里云、腾讯云挂了之后,我分析了这十家云巨头的SLA

     

    最近,阿里云、腾讯云等各大云厂商接连出现宕机问题,用户对 “云”的可靠性、安全性产生了越来越多的质疑。其中,腾讯云的事故还引来了一场数据损失的诉讼官司,而作为诉讼赔偿依据的用户服务等级协议也引起了人们的强烈关注。

    我们查阅了十家云巨头的用户服务等级协议,发现了一些有意思的现象。

    1、 SLA:提供商与用户的服务等级协议

    SLA服务等级协议(service level agreement, SLA)是在一定开销下为保障服务的性能和可靠性,服务提供商与用户间定义的一种双方认可的协定。通常这个开销是驱动提供服务质量的主要因素。

    一个完整的SLA同时也是一个合法的文档,包括所涉及的当事人、协定条款(包含应用程序和支持的服务)、违约的处罚、费用和仲裁机构、政策、修改条款、报告形式和双方的义务等。同样服务提供商可以对用户在工作负荷和资源使用方面进行规定。

    通常情况下,协议中的“可用性”是衡量服务商所提供服务质量的重要标准之一,直接表明了用户在服务周期内所能使用该服务的时间的比例;“不可用时间”主要指除了正常维修及其他说明的情况以外,用户不能正常使用所购买服务的时间总和;当不可用时间超过服务商承诺的最高标准时,服务商须向用户进行一定的赔偿。

    本文主要通过对比不同厂商SLA中“云”的可用性、不可用时间和发生违约时的赔偿情况详细介绍各大云服务商的用户服务等级协议。

    二、云可用性最高达99.99%,超出最低0.09个百分点

    1.不可用性和不可用时间

    阿里云等三家服务商对云的“不可用性”给出了明确定义,具体内容如下:

    阿里云:当一台设置了出入允许规则的ECS实例以TCP或者UDP协议与任一IP地址的双向(出/入)都无法联通,且该状态持续一分钟以上,视为该分钟内ECS实例不可用。

    华为云:"服务不可用"指弹性云服务器系统中日志显示:因华为云原因连续超过5分钟无法访问并且使用弹性云服务器,低于五分钟的不可用时间不计算在内,其中服务不可用不包含因系统维护(包括割接、维护、升级)所引起的不可用、服务暂停、由用户或第三方原因及不可抗力导致的不可用。

    AWS:就Amazon EBS而言,系指用户的所有附加卷在队列中存在待处理输入输出请求的情况下,未进行读写输入输出操作。

    综合以上内容可以将云计算不可用的定义理解为:用户的操作在一定的时间内得不到任何响应,这种情况被视为云计算的不可用。

    对于不可用时间的计算,云计算服务方也给出了明确的方法,如美团云承诺云主机的服务可用性为99.95%,即用户每月服务可用时间应为30天*24小时*60分钟*99.95%=43178.4分钟。值得注意的是,在对不可用时间的界定中,不同厂商采取的分界时间略有不同:除日常系统维护、用户原因、不可抗力引起的不可用不计入不可用时间以外,Ucloud和阿里云规定低于一分钟或一分钟内修复的不可用现象不计入不可用时间;百度云、美团云、华为云、腾讯云、青云、金山云规定低于五分钟或五分钟内修复的不可用现象不计入不可用时间;微软Azure和AWS则没有关于这方面的规定。

    表1 不可用时间的界定

    2、云计算厂商服务可用性在99.9%到99.99%之间波动

    可用性是云计算中衡量服务质量的重要指标,所谓可用性指的是在所需要资源得到保证的前提下,云计算服务提供商能够在规定的条件下,在给定的时间间隔内,依据之前签订的SLA向用户提供服务的能力,不同服务商的可用性有所不同,此外,他们的衡量标准也并不统一。

    表2 十家云计算厂商的可用性

    据上表所示,阿里云、华为云、微软Azure与其他七个厂商的可用性表述不同,他们的可用性在不同条件下占有不同的比例。对于单实例维度, 阿里云承诺一个服务周期内ECS的服务可用性不低于99.95%,对于单地域多可用区维度,阿里云承诺一个服务周期内ECS的服务可用性不低于99.99%。;华为云通过商业和技术上的合理努力,承诺单个弹性云服务器可用率达到99.95%;微软承诺同一区域内多个可用区的弹性云服务可用性达到99.99%;对于在同一 Azure 区域中跨两个或更多可用性区域部署了两个或多个实例的所有虚拟机,则保证用户可在不少于 99.99% 的时间内与至少一个实例具有虚拟机连接性。对于在同一可用性集中部署了两个或多个实例的所有虚拟机,在不少于 99.95% 的时间内与至少一个实例具有虚拟机连接。对于所有操作系统磁盘和数据磁盘均使用高级存储的任一单实例虚拟机,将在不少于99.9%的时间内具有虚拟机连接性。

    各个云计算厂商的可用性均保持在99.95%左右,其中AWS稳定在99.99%,为行业最高水平;金山云则稍低于平均水平,为99.9%;结合所有数据可得:目前云计算厂商所提供服务的可用性在99.9%到99.99%之间波动。

    三、云厂商的三种赔偿方式

    1.赔偿标准和方法

    当服务商所提供业务达不到协议中所保证的可用性标准时,应该对用户因此产生的损失进行赔偿,SLA应该针对赔偿方式和用户提出索赔的时限做出详细说明,以便在产生纠纷时有据可依。

    表3 各云计算厂商赔偿方法

    在涉及赔偿问题的八家业务提供商中共有四种赔偿方法,分别是:代金券、使用时长、服务费用减免和折扣账单,在发生服务未达标的情况下,商家通过这些方式对用户进行补偿。用户必须在协议规定的时限内向服务商提出索赔,超过时限的索赔要求无效。

    为了更直观地对这些云计算服务商的赔偿力度进行对比,本文假设某用户在某云计算平台以月费用700元购买服务,但六月份发生了单次5分钟以上的的故障时间共计30分钟,那么其在各个云计算平台可获得的赔偿如下:

                      表4 各云计算厂商赔偿金额

    由上表可以看出,在用户由于服务商的原因产生损失时,所得赔偿最多为故障时间的百倍使用时长或时长所需服务费的等额代金券,且代金券或现金的数目不能超过当月用户所预付的服务费用。虽然总体上,各个服务商的赔偿对弥补用户的损失都无济于事,但比较来看,青云的赔偿力度最低。

    2、索赔时限

    表5  各云计算厂商索赔时限

    发生索赔事件后,一般情况下,云计算服务商要求在一定的时限内接到用户的索赔申请,随后根据一定流程按照SLA协议中的赔偿标准对用户进行理赔,超过规定期限的索赔申请,服务商视为无效,有权利拒绝赔偿。

    在所有云计算服务商中,腾讯云、美团云和百度云在SLA的赔偿条款中并没有明确的索赔时间限制,对用户的理赔时限限制最为宽松。

    在有索赔时间限制的云计算服务商中,阿里云的期限要求最长,即客户可以在每月第五(5)个工作日后对上个月没有达到可用性的ECS实例提出赔偿申请。赔偿申请必须限于在ECS没有达到服务可用性的相关月份结束后两(2)个月内提出。超出申请时限的赔偿申请将不被受理。

    华为云和金山云的时限最短,需要用户在服务不可用事件发生之日起7个工作日内,及时提交补偿申请,如未按要求在规定时间内提交赔偿申请,将无法及时获得赔偿。

    3、赔偿流程

    如果用户因为云计算厂商的服务未达到SLA中承诺的标准而造成损失的,可以按照既定流程向对方提出索赔申请,在SLA协议中明确索赔流程的只有微软和华为云两家,其中,微软的赔偿流程最为详细。

    微软Azure:若要微软考虑索赔,用户必须将索赔提交给微软公司的客户支持,并在其中包含微软确认索赔所需的所有信息,包括但不限于:(i) 详细的事件说明;(ii) 与停机时间和持续时间有关的信息;(iii) 受影响用户(如果有)的数量和位置;以及 (iv) 用户在事件发生时为解决事件所做的尝试的说明。

    对于与 Microsoft Azure 有关的索赔,微软要求必须在索赔缘起事件发生的帐单月份结束后的两个月内收到索赔。对于与所有其他服务相关的索赔,则必须在事件发生月份的下一个日历月结束前收到索赔。例如,如果事件发生在2月15日,那么服务方必须在3月31日前收到索赔和所有必需信息。

    微软将对用户提供的所有信息进行合理评估,并依据诚信原则就是否适用服务费用减免做出决定。微软将在收到索赔的下一个月(在四十五 (45) 天内)使用商业上合理的措施来处理索赔。用户必须遵守协议才有资格获得服务费用减免。如果服务方确定用户适用服务费用减免,那么他们将对适用月服务费进行减免。

    华为云:若因华为云原因导致服务不可用,用户可以在华为云用户中心提交工单以申请第三条约定的赔偿。

    工单格式基本要求:

    1)工单类型选择“财务类”;

    2)问题类型选择“赔偿类”;

    3)问题描述包含用户的账号、服务不可用的时间和次数、订购的华为云服务访问日志。

    用户需要在服务不可用事件发生之日起7个工作日内,按照协议规定及时提交补偿申请,如未按要求在前述规定时间内提交赔偿申请,将无法及时获得赔偿。

    不管是什么样的云计算服务商,在用户对发生的损失进行索赔时,一般都分为三个步骤:

    1) 在服务商规定的时限内,向其提出索赔申请,并提供服务商要求的一些列材料;

    2) 等待服务商审核;

    3) 服务商按照SLA的相关规定对用户进行赔偿。

    虽然赔偿的流程基本相同,但具体细则可能存在较大差异,如赔偿方式、赔偿时限、赔偿力度等等,这些都要求用户在购买服务前或理赔前对相关协议有足够的认识。

    四、SLA存在的问题

    1.用户没有要求更改协议的权利

    在制定SLA协议时,业务供应商拥有绝对的权利,用户没有任何参与权,若想使用该产品,必须被动地接收厂商列出的所有条约,颇有些“霸王条款”的味道,如青云在协议中明确列出:青云公司有权单方调整、修订服务等级协议的全部或部分条款,并通过站内信、邮件通知等方式予以公布。如用户不同意服务等级协议的修改,用户有权停止使用QingCloud虚拟主机服务,如继续使用QingCloud虚拟主机服务,则视为接受修改后的本服务等级协议。

    在这样的情况下,用户的权益得不到保障,供应商从自身利益的角度制定了双方应该遵守的合约,即使用户产生损失,厂商根据协议做出的赔偿也是微不足道的。

    当然,这样由供应商单方面制定协议的现象并不少见,在软件下载安装中,如果不选择“同意”选项,流程往往无法进行,甚至有时只有“同意”一个选项。这种现象引起了网友的广泛吐槽,却没有得到任何缓解。在现在这样一个互联网时代,软件渐渐成为日常生活中的必需品,作为公民生活的基础,如果软件使用者的权益得不到保障,那么用户和供应商之间的不平等程度会随着时间的推移而逐渐加剧,最终产生一系列社会问题。

    2.赔偿标准太笼统,且未保障客户权益

    除了赔偿标准不利于消费者以外,赔偿方式对发生损失的客户来说可能也是无济于事,在SAL协议中提到赔偿的八家业务提供商中,所有厂商都以优惠券和使用时长等方式进行赔偿,抛开赔偿力度太小不谈,这种赔偿对供应商来说,几乎等于没有任何损失,延长使用时长和发放优惠券对不打算继续使用该平台的客户没有任何意义,对继续使用的客户也无甚意义。例如腾讯云延长使用时长的赔偿方式,如果宕机时间为一小时,按照100赔偿的标准,应当延长用户100小时的使用时间,也就是4天多一点,在工作中,宕机一小时多公司造成的损失很可能是巨大,甚至是不可估量的,而获得的赔偿仅仅是4天的使用时长,这对用户来说,显然有失公平。

    3.用户隐私无法保障

    互联网时代,解决用户隐私泄露问题,就是解决数据发展与使用的问题。而商业社会发展到今天,人们已很难有“隐私”可言。那些躺在手机信箱中的垃圾短信就是最好的例证。

    如果个人数据的外泄意味着隐私的暴露,那么商业数据的泄露造成的影响可就不可估量了。查阅各个云计算厂商的用户服务等级协议可以发现,业务提供商会就用户数据的隐私问题进行单独说明,一般而言,他们向用户承诺数据的隐私性,但在以下几种情况下,需要提供用户的相关数据:

    1)有关法律、法规规定或云对象存储合法服务程序规定;

    2)在紧急情况下,为维护客户及公众的权益;

    3)为维护云厂商的商标权、专利权及其他任何合法权益;

    4)依据现行法律法规或根据政府监管部门监管、安全合规、审计或取证调查等原因的需要;

    5)其他依法需要公开、编辑或透露个人信息的情况。

    这些条款明确表明,除特殊情况以外,业务提供商绝对维护用户的隐私,但问题是,协议中并没有关于数据泄露后的处理办法,也就是说,一旦用户隐私泄露,没有相应的条款要求厂家提供相应的赔偿。这意味着,协议中的隐私保护条款只相当于业务提供商的一个口头保证,在就隐私泄露的纠纷上,对使用者提供不了任何法律保护的依据。

    五、给云计算用户的四大建议

    随着云计算应用的推广,用户在购买云计算服务时一定要为了自身的利益,事先认真研读与服务提供商之间的服务等级协议SLA。尤其要注意的是:

    1)服务商做出的可用性承诺以及不可用时间的范围;

    2)一旦发生损失该在什么时限内按照怎样的流程向商家提出索赔;

    3)哪些原因造成的损失不在索赔范围内;

    4)很多云计算服务商在SLA协议中对用户的职责进行了说明,用户在使用期间必须遵守相应的条约,否则商家有权利对用户提出索赔。

    此外,虽然SLA由服务商事先准备,但并非所有SLA都是一成不变的。用户在进行重要交易前,可以与云供应商一起查看协议内容,看看是否有可以协商的空间。如有可能,应考虑针对SLA中对他们最重要的部分进行谈判协商。

    各个云计算服务商SLA原件在网上方可查询

    相关文章

      网友评论

        本文标题:阿里云、腾讯云挂了之后,我分析了这十家云巨头的SLA

        本文链接:https://www.haomeiwen.com/subject/rpzhlqtx.html