Redis：分布式锁

作者: yingzong | 来源:发表于2016-08-06 16:50 被阅读851次

大佬浅谈分布式锁
分布式锁之redis-lua脚本
死磕 java同步系列之redis分布式锁进化史
Zookeeper实现分布式锁（一）While版
基于redis实现的分布式锁
Redis的基本使用（-）分布式锁
使用JVM提高秒杀系统性能
14 Spring Schedule + Redis分布式锁构建
Redis分布式锁
秒杀随笔

Java多线程开发中锁提供了原子性、可见性。但是在分布式系统中，一个进程下的多个线程分布到一个集群中的多台机器上，需要其他方式来保证原子性、可见性。通过封装Redis的SETNX命令，可以实现分布式锁，提供分布式环境下的原子性。

测试代码

测试代码启动三个名称为test-1、test-2、test-3线程，线程内部会对同一个静态变量执行一万次++操作，如果代码正确，最终静态变量的值应该为3万。测试代码如下：

public class LockTest {

    public static int i = 0;

    public static void main(String[] args) throws InterruptedException {
        CountDownLatch countDownLatch = new CountDownLatch(3);
        CyclicBarrier cyclicBarrier = new CyclicBarrier(3);
        new Thread(new CountRunnable(countDownLatch, cyclicBarrier), "test-1").start();
        new Thread(new CountRunnable(countDownLatch, cyclicBarrier), "test-2").start();
        new Thread(new CountRunnable(countDownLatch, cyclicBarrier), "test-3").start();
        countDownLatch.await();
        System.out.println(LockTest.i);
    }

    static class CountRunnable implements Runnable{

        private CountDownLatch countDownLatch;
        private CyclicBarrier cyclicBarrier;

        public CountRunnable(CountDownLatch countDownLatch, CyclicBarrier cyclicBarrier){
            this.countDownLatch = countDownLatch;
            this.cyclicBarrier = cyclicBarrier;
        }

        @Override
        public void run() {
            try {
                cyclicBarrier.await();
            } catch (Exception e) {
                e.printStackTrace();
            }
            for(int j = 0; j < 10000; j++){
                LockTest.i++;
            }
            countDownLatch.countDown();
        }
    }
}

在不使用锁的情况下，执行三次输出结果分别为：24404、21768、17539。

简单版本

SETNX命令只有当key不存在时才能设值成功，返回值为1；key存在设值失败，返回0。根据命令特性，可以有以下实现：

public class SimpleRedisLock {

    public static ThreadLocal<Jedis> holder = new ThreadLocal<>();

    public static JedisPool jedisPool = new JedisPool(new JedisPoolConfig(), "localhost");

    public static void acquire(String lock){
        Jedis jedis = jedisPool.getResource();
        while(jedis.setnx(lock, "") == 0){}
        holder.set(jedis);
    }

    public static void release(String lock){
        Jedis jedis = holder.get();
        jedis.del(lock);
        jedis.close();
    }

}

在acquire方法内部，获取jedis对象，循环设置某个key的值，直到设置成功。release方法中删除这个key，代表释放锁。修改LockTest代码：

for(int j = 0; j < 10000; j++){
    SimpleRedisLock.acquire("lock");
    LockTest.i++;
    SimpleRedisLock.release("lock");
}

重新执行测试代码，输入值：30000。

简单版本的问题

测试代码中启动了3个线程竞争同一个分布式锁，如果三个线程中，有任意一个线程在调用SimpleRedisLock的acquire成功之后异常退出，没有释放锁，另外两个线程会死循环等待在SETNX命令上，简单修改一下LockTest，模拟test-1异常退出的情况：

@Override
public void run() {
    try {
        cyclicBarrier.await();
        for(int j = 0; j < 10000; j++){
            SimpleRedisLock.acquire("lock");
            if(Thread.currentThread().getName().equals("test-1")){
                throw new RuntimeException();
            }
            LockTest.i++;
            SimpleRedisLock.release("lock");
        }
    } catch (Exception e) {
        e.printStackTrace();
    }finally {
        countDownLatch.countDown();
    }
}

线程test-�1在获取到分布式锁之后，因为运行时异常退出（也有可能是因为进程、机器crash，OOM等各种问题），没有正确的释放锁，导致线程test-2、test-3死循环执行SETNX命令。

死锁

解决死锁问题

按照Redis文档给出的一种解决方法，重新修改acquire方法：

public static void acquire(String lock){
    Jedis jedis = jedisPool.getResource();
    //1.先尝试用setnx命令获取锁,key为参数lock,值为当前时间+要持有锁的时间hold_time
    while(jedis.setnx(lock, String.valueOf(System.currentTimeMillis() + hold_time)) == 0){
        //2.如果获取失败,检查lock对应的值是否已超时
        String expireTime = jedis.get(lock);
        if(expireTime != null && Long.parseLong(expireTime) < System.currentTimeMillis()){
            //3.如果已经超时了,使用getset命令,设置新的超时时间
            String oldExpire = jedis.getSet(lock, String.valueOf(System.currentTimeMillis() + hold_time));
            if(oldExpire != null && Long.parseLong(expireTime) < System.currentTimeMillis()){
                //4.如果setget命令返回的值,依然是过期时间,认为获取锁成功
                break;
            }
        }
    }
    holder.set(jedis);
}

测试代码执行结果：

test-1异常退出情况

在test-1线程退出后，程序正常执行，并得到了正确结果2万。但这个版本依旧有两个问题没有解决:

test-1线程异常退出，test-2、test-3线程同时执行setnx失败，获取expireTime，发现已经小于currentTime，开始执行getset命令。假设test-2先执行了getset，获取锁成功。test-3线程在执行getset时，返回的是test-2设置的未超时的时间戳，是一个未超时的时间，获取锁失败。功能上没有问题，但test-2线程持有的锁的有效期时间戳已经被test-3修改了。
如果test-2线程在持有锁的期间，因为网络抖动等原因，操作（测试代码中对应++操作部分）还没有完成，但锁已经超时了。如何确定是否要释放锁（即使客户端记录自己的超时时间戳也没用，问题1中已经描述了时间戳被其他线程修改的情况）？在需要互斥访问资源的场景，执行时间超过锁超时时间的情况下，怎么解决多个节点同时访问资源的情况（同时执行++操作）？

解决问题

重新修改获取锁的代码：

public class SimpleRedisLock {

    public static long hold_time = 3000;

    public static ThreadLocal<Jedis> holder = new ThreadLocal<>();

    public static ThreadLocal<String> expireHolder = new ThreadLocal<>();

    public static JedisPool jedisPool = new JedisPool(new JedisPoolConfig(), "localhost");

    public static void acquire(String lock){
        Jedis jedis = jedisPool.getResource();
        //1.先尝试用setnx命令获取锁,key为参数lock,值为当前时间+要持有锁的时间hold_time
        while(jedis.setnx(lock, String.valueOf(System.currentTimeMillis() + hold_time)) == 0){
            //2.如果获取失败,先watch lock key
            jedis.watch(lock);
            //3.获取当前超时时间
            String expireTime = jedis.get(lock);
            if(expireTime != null && Long.parseLong(expireTime) < System.currentTimeMillis()){
                //4.如果超时时间小于当前时间,开事务准备更新lock值
                Transaction transaction = jedis.multi();
                Response<String> response = transaction.getSet(lock, String.valueOf(System.currentTimeMillis() + hold_time));
                //5.步骤2设置了watch,如果lock的值被其他线程修改,不是执行事务中的命令
                if(transaction.exec() != null){
                    String oldExpire = response.get();
                    if(oldExpire != null && Long.parseLong(expireTime) < System.currentTimeMillis()){
                        //6.如果setget命令返回的值依然是过期时间,认为获取锁成功(加了watch之后,这里返回的应该一直是超时时间)
                        break;
                    }
                }
            }else{
                //如果key未超时,解除watch
                jedis.unwatch();
            }
        }
        //设置客户端超时时间
        expireHolder.set(jedis.get(lock));
        holder.set(jedis);
    }

    public static void release(String lock){
        Jedis jedis = holder.get();
        //比较客户端超时时间与lock值,判断是否还由自己持有锁
        if(jedis.get(lock).equals(expireHolder.get())){
            jedis.del(lock);
        }
        jedis.close();
    }

}

新的acquire方法，通过watch、redis事务，保证只有一个客户端能执行getset，并记录了锁超时时间，解决了问题一和问题二的前半部分。对于锁超时导致的两个客户端同时访问资源，只能靠业务代码保证锁超时时间内可以完成处理（可以在release时检查是否超时，如果超时回滚所有操作，但对不能回滚的，例如++操作就比较麻烦），或者放弃死锁容错功能，需要看场景衡量。

代码：SimpleRedisLock

扩展

以上只是单点redis服务器情况下的分布式锁。在redis master-slaver架构下，如果master节点down机，由于redis主从复制是异步的，会有明显的race-condition。Redis文档中提供了一种解决方案：RedLock。

大佬浅谈分布式锁
redis 实现 redis 分布锁一、redis 实现分布式锁（可重入锁）redission 实现分布式锁1、对...
分布式锁之redis-lua脚本
目录 redis分布式锁，Lua，Lua脚本，lua redis，redis lua 分布式锁，redis set...
死磕 java同步系列之redis分布式锁进化史
问题（1）redis如何实现分布式锁？（2）redis分布式锁有哪些优点？（3）redis分布式锁有哪些缺点...
Zookeeper实现分布式锁（一）While版
前面文章讲解了用Redis实现分布式锁的方式：分布式锁之Redis实现（acquire）分布式锁之Redis实现...
基于redis实现的分布式锁
本文要点基于redis实现分布式锁demo 基于redis实现分布式锁原理基于redis实现分布式锁优缺点正...
Redis的基本使用（-）分布式锁
Redis的基本使用（-）分布式锁 1、Redis做分布式锁分布式锁是Redis较常见的使用场景。问题场景：...
使用JVM提高秒杀系统性能
前提使用redis分布式锁，解决秒杀系统库存为零继续扣减问题 redis分布式锁出现的问题使用redis锁，...
14 Spring Schedule + Redis分布式锁构建
1.Redis分布式锁流程图 2. Redis分布式锁优化版流程图 3. Redis分布式锁常用的几个命令 set...
Redis分布式锁
1.Redis分布式锁概述除了Redis，还能使用什么作为分布式锁？利用Redis的setnx（SET if ...
秒杀随笔
方法： mysql悲观锁 mysql乐观锁 PHP+redis分布式锁 PHP+redis乐观锁(redis wa...