接口设计的幂等性考虑

作者: 南乡清水 | 来源:发表于2018-03-26 16:49 被阅读189次

    分布式系统接口幂等性

    1.幂等性定义

    1.1 数学定义

    在数学里,幂等有两种主要的定义:- 在某二元运算下,幂等元素是指被自己重复运算(或对于函数是为复合)的结果等于它自己的元素。例如,乘法下唯一两个幂等实数为0和1。即 s *s = s- 某一元运算为幂等的时,其作用在任一元素两次后会和其作用一次的结果相同。例如,高斯符号便是幂等的,即f(f(x)) = f(x)。

    1.2 HTTP规范的定义

    在HTTP/1.1规范中幂等性的定义是:

    A request method is considered "idempotent" if the intended effect on the server of multiple identical requests with that method is the same as the effect for a single such request. Of the request methods defined by this specification, PUT, DELETE, and safe request methods are idempotent.

    HTTP的幂等性指的是一次和多次请求某一个资源应该具有相同的副作用。如通过PUT接口将数据的Status置为1,无论是第一次执行还是多次执行,获取到的结果应该是相同的,即执行完成之后Status =1。

    2. 何种接口提供幂等性

    2.1 HTTP支持幂等性的接口

    在HTTP规范中定义GET,PUT和DELETE方法应该具有幂等性。

    • GET方法

    The GET method requests transfer of a current selected representation for the target resource,GET is the primary mechanism of information retrieval and the focus of almost all performance optimizations. Hence, when people speak of retrieving some identifiable information via HTTP, they are generally referring to making a GET request.

    GET方法是向服务器查询,不会对系统产生副作用,具有幂等性(不代表每次请求都是相同的结果)

    • PUT方法

    The PUT method requests that the state of the target resource be created or replaced with the state defined by the representation enclosed in the request message payload.

    也就是说PUT方法首先判断系统中是否有相关的记录,如果有记录则更新该记录,如果没有则新增记录。

    • DELETE 方法

    The DELETE method requests that the origin server remove the association between the target resource and its current functionality. In effect, this method is similar to the rm command in UNIX: it expresses a deletion operation on the URI mapping of the origin server rather than an expectation that the previously associated information be deleted.

    DELETE方法是删除服务器上的相关记录。

    2.2 实际业务

    现在简化为这样一个系统,用户购买商品的订单系统与支付系统;订单系统负责记录用户的购买记录已经订单的流转状态(orderStatus),支付系统用于付款,提供

    boolean pay(int accountid,BigDecimal amount) //用于付款,扣除用户的
    

    接口,订单系统与支付系统通过分布式网络交互。


    订单幂等性

    这种情况下,支付系统已经扣款,但是订单系统因为网络原因,没有获取到确切的结果,因此订单系统需要重试。由上图可见,支付系统并没有做到接口的幂等性,订单系统第一次调用和第二次调用,用户分别被扣了两次钱,不符合幂等性原则(同一个订单,无论是调用了多少次,用户都只会扣款一次)。如果需要支持幂等性,付款接口需要修改为以下接口:

    boolean pay(int orderId,int accountId,BigDecimal amount)
    

    通过orderId来标定订单的唯一性,付款系统只要检测到订单已经支付过,则第二次调用不会扣款而会直接返回结果:

    订单支持幂等

    在不同的业务中不同接口需要有不同的幂等性,特别是在分布式系统中,因为网络原因而未能得到确定的结果,往往需要支持接口幂等性。

    3.分布式系统接口幂等性

    随着分布式系统及微服务的普及,因为网络原因而导致调用系统未能获取到确切的结果从而导致重试,这就需要被调用系统具有幂等性。例如上文所阐述的支付系统,针对同一个订单保证支付的幂等性,一旦订单的支付状态确定之后,以后的操作都会返回相同的结果,对用户的扣款也只会有一次。这种接口的幂等性,简化到数据层面的操作:

    update userAmount set amount =  'value' ,paystatus = 'paid' where orderId= 'orderid' and paystatus = 'unpay'
    

    其中value是用户要减少的订单,paystatus代表支付状态,paid代表已经支付,unpay代表未支付,orderid是订单号。在上文中提到的订单系统,订单具有自己的状态(orderStatus),订单状态存在一定的流转。订单首先有提交(0),付款中(1),付款成功(2),付款失败(3),简化之后其流转路径如图:


    订单状态流转的幂等性

    当orderStatus = 1 时,其前置状态只能是0,也就是说将orderStatus由0->1 是需要幂等性的

    update Order set orderStatus = 1 where OrderId = 'orderid' and orderStatus = 0
    

    当orderStatus 处于0,1两种状态时,对订单执行0->1 的状态流转操作应该是具有幂等性的。这时候需要在执行update操作之前检测orderStatus是否已经=1,如果已经=1则直接返回true即可。

    但是如果此时orderStatus = 2,再进行订单状态0->1 时操作就无法成功,但是幂等性是针对同一个请求的,也就是针对同一个requestid保持幂等。

    这时候再执行

    update Order set orderStatus = 1 where OrderId = 'orderid' and orderStatus = 0
    

    接口会返回失败,系统没有产生修改,如果再发一次,requestid是相同的,对系统同样没有产生修改。

    4.解决方案

    在微服务架构下,我们在完成一个订单流程时经常遇到下面的场景:

    1. 一个订单创建接口,第一次调用超时了,然后调用方重试了一次
    2. 在订单创建时,我们需要去扣减库存,这时接口发生了超时,调用方重试了一次
    3. 当这笔订单开始支付,在支付请求发出之后,在服务端发生了扣钱操作,接口响应超时了,调用方重试了一次
    4. 一个订单状态更新接口,调用方连续发送了两个消息,一个是已创建,一个是已付款。但是你先接收到已付款,然后又接收到了已创建
    5. 在支付完成订单之后,需要发送一条短信,当一台机器接收到短信发送的消息之后,处理较慢。消息中间件又把消息投递给另外一台机器处理

    以上问题,就是在单体架构转成微服务架构之后,带来的问题。当然不是说单体架构下没有这些问题,在单体架构下同样要避免重复请求。但是出现的问题要比这少得多。

    为了解决以上问题,就需要保证接口的幂等性,接口的幂等性实际上就是接口可重复调用,在调用方多次调用的情况下,接口最终得到的结果是一致的。有些接口可以天然的实现幂等性,比如查询接口,对于查询来说,你查询一次和两次,对于系统来说,没有任何影响,查出的结果也是一样。

    除了查询功能具有天然的幂等性之外,增加、更新、删除都要保证幂等性。那么如何来保证幂等性呢?

    全局唯一ID

    如果使用全局唯一ID,就是根据业务的操作和内容生成一个全局ID,在执行操作前先根据这个全局唯一ID是否存在,来判断这个操作是否已经执行。如果不存在则把全局ID,存储到存储系统中,比如数据库、redis等。如果存在则表示该方法已经执行。

    从工程的角度来说,使用全局ID做幂等可以作为一个业务的基础的微服务存在,在很多的微服务中都会用到这样的服务,在每个微服务中都完成这样的功能,会存在工作量重复。另外打造一个高可靠的幂等服务还需要考虑很多问题,比如一台机器虽然把全局ID先写入了存储,但是在写入之后挂了,这就需要引入全局ID的超时机制。

    使用全局唯一ID是一个通用方案,可以支持插入、更新、删除业务操作。但是这个方案看起来很美但是实现起来比较麻烦,下面的方案适用于特定的场景,但是实现起来比较简单。

    去重表

    这种方法适用于在业务中有唯一标的插入场景中,比如在以上的支付场景中,如果一个订单只会支付一次,所以订单ID可以作为唯一标识。这时,我们就可以建一张去重表,并且把唯一标识作为唯一索引,在我们实现时,把创建支付单据和写入去去重表,放在一个事务中,如果重复创建,数据库会抛出唯一约束异常,操作就会回滚。

    插入或更新

    这种方法插入并且有唯一索引的情况,比如我们要关联商品品类,其中商品的ID和品类的ID可以构成唯一索引,并且在数据表中也增加了唯一索引。这时就可以使用InsertOrUpdate操作。在mysql数据库中如下:

    insert into goods_category (goods_id,category_id,create_time,update_time) 
           values(#{goodsId},#{categoryId},now(),now()) 
           on DUPLICATE KEY UPDATE
           update_time=now()
    

    多版本控制

    这种方法适合在更新的场景中,比如我们要更新商品的名字,这时我们就可以在更新的接口中增加一个版本号,来做幂等

    boolean updateGoodsName(int id,String newName,int version);
    

    在实现时可以如下

    update goods set name=#{newName},version=#{version} where id=#{id} and version<${version}
    

    状态机控制

    这种方法适合在有状态机流转的情况下,比如就会订单的创建和付款,订单的付款肯定是在之前,这时我们可以通过在设计状态字段时,使用int类型,并且通过值类型的大小来做幂等,比如订单的创建为0,付款成功为100。付款失败为99

    在做状态机更新时,我们就这可以这样控制

    update `order` set status=#{status} where id=#{id} and status<#{status}
    

    以上就是保证接口幂等性的一些方法。

    References

    分布式系统接口幂等性

    相关文章

      网友评论

      • 哥哥_d18a:写的清晰明了
        南乡清水:@哥哥_d18a 记录给自己用的
      • 非走不可123:假设第一次接口调用执行成功,但是返回结果给客户端的时候超时,当客户端重试的时候,由于幂等性限制,重试的请求不再执行,那么这一次重试直接返回失败?还是返回第一次执行成功的结果?
        南乡清水:@非走不可123 可以在你更新或者删除的地方去处理返回结果,不需要缓存
        非走不可123:@南乡清水 嗯,如果返回成功,那结果应该是在第一次调用的时候产生的,这时候怎么获取到第一次调用结果呢?将第一次调用结果放缓存吗?
        南乡清水:@非走不可123 可以返回成功或失败,看应用场景,如果是公司后台,失败也无所谓的,如果给用户,可以拦截到这个重复异常,然后处理
      • 72f8fb552d60:下次写接口也要考虑下了,之前都没管
        南乡清水:@牛牛的舞 哈哈

      本文标题:接口设计的幂等性考虑

      本文链接:https://www.haomeiwen.com/subject/ismrcftx.html