【分布式锁】02-使用Redisson实现公平锁原理

2020-03-21 09:37:46 浏览数 (1)

前言

前面分析了Redisson可重入锁的原理,主要是通过lua脚本加锁及设置过期时间来保证锁执行的原子性,然后每个线程获取锁会将获取锁的次数 1,释放锁会将当前锁次数-1,如果为0则表示释放锁成功。

可重入原理和JDK中的可重入锁都是一致的。

Redisson公平锁原理

JDK中也有公平锁和非公平锁,所谓公平锁,就是保证客户端获取锁的顺序,跟他们请求获取锁的顺序,是一样的。公平锁需要排队,谁先申请获取这把锁,谁就可以先获取到这把锁,是按照请求的先后顺序来的。

Redisson实现公平锁源码分析

非公平锁使用也很简单:

代码语言:javascript复制
1RLock lock = redisson.getFairLock("anyLock");
2lock.lock();
3lock.unlock();

核心lua脚本代码:

代码语言:javascript复制
 1<T> RFuture<T> tryLockInnerAsync(long leaseTime, TimeUnit unit, long threadId, RedisStrictCommand<T> command) {
 2    internalLockLeaseTime = unit.toMillis(leaseTime);
 3
 4    long currentTime = System.currentTimeMillis();    
 5    if (command == RedisCommands.EVAL_LONG) {
 6        return commandExecutor.evalWriteAsync(getName(), LongCodec.INSTANCE, command,
 7                // remove stale threads
 8                "while true do "
 9                  "local firstThreadId2 = redis.call('lindex', KEYS[2], 0);"
10                  "if firstThreadId2 == false then "
11                      "break;"
12                  "end; "
13                  "local timeout = tonumber(redis.call('zscore', KEYS[3], firstThreadId2));"
14                  "if timeout <= tonumber(ARGV[4]) then "
15                      "redis.call('zrem', KEYS[3], firstThreadId2); "
16                      "redis.call('lpop', KEYS[2]); "
17                  "else "
18                      "break;"
19                  "end; "
20                "end;"
21
22                    "if (redis.call('exists', KEYS[1]) == 0) and ((redis.call('exists', KEYS[2]) == 0) "
23                          "or (redis.call('lindex', KEYS[2], 0) == ARGV[2])) then "  
24                        "redis.call('lpop', KEYS[2]); "  
25                        "redis.call('zrem', KEYS[3], ARGV[2]); "  
26                        "redis.call('hset', KEYS[1], ARGV[2], 1); "  
27                        "redis.call('pexpire', KEYS[1], ARGV[1]); "  
28                        "return nil; "  
29                    "end; "  
30                    "if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then "  
31                        "redis.call('hincrby', KEYS[1], ARGV[2], 1); "  
32                        "redis.call('pexpire', KEYS[1], ARGV[1]); "  
33                        "return nil; "  
34                    "end; "  
35
36                    "local firstThreadId = redis.call('lindex', KEYS[2], 0); "  
37                    "local ttl; "   
38                    "if firstThreadId ~= false and firstThreadId ~= ARGV[2] then "   
39                        "ttl = tonumber(redis.call('zscore', KEYS[3], firstThreadId)) - tonumber(ARGV[4]);"   
40                    "else "
41                        "ttl = redis.call('pttl', KEYS[1]);"   
42                    "end; "   
43
44                    "local timeout = ttl   tonumber(ARGV[3]);"   
45                    "if redis.call('zadd', KEYS[3], timeout, ARGV[2]) == 1 then "  
46                        "redis.call('rpush', KEYS[2], ARGV[2]);"  
47                    "end; "  
48                    "return ttl;", 
49                    Arrays.<Object>asList(getName(), threadsQueueName, timeoutSetName), 
50                                internalLockLeaseTime, getLockName(threadId), currentTime   threadWaitTime, currentTime);
51    }
52
53    throw new IllegalArgumentException();
54}
KEYS/ARGV参数分析

KEYS = Arrays.asList(getName(), threadsQueueName, timeoutSetName)

  • KEYS1 = getName() = 锁的名字,“anyLock”
  • KEYS[2] = threadsQueueName = redisson_lock_queue:{anyLock},基于redis的数据结构实现的一个队列
  • KEYS[3] = timeoutSetName = redisson_lock_timeout:{anyLock},基于redis的数据结构实现的一个Set数据集合,有序集合,可以自动按照你给每个数据指定的一个分数(score)来进行排序

ARGV = internalLockLeaseTime, getLockName(threadId), currentTime threadWaitTime, currentTime

  • ARGV1 = 30000毫秒
  • ARGV[2] = UUID:threadId
  • ARGV[3] = 当前时间(10:00:00) 5000毫秒 = 10:00:05
  • ARGV[4] = 当前时间(10:00:00)
模拟不同线程获取锁步骤
  1. 客户端A thread01 10:00:00 获取锁(第一次加锁)
  2. 客户端B thread02 10:00:10 获取锁
  3. 客户端C therad03 10:00:15 获取锁
lua脚本源码分析
客户端A thread01 加锁分析

thread01 在10:00:00 执行加锁逻辑,下面开始一点点分析lua脚本执行代码:

代码语言:javascript复制
1"while true do "
2  "local firstThreadId2 = redis.call('lindex', KEYS[2], 0);"
3  "if firstThreadId2 == false then "
4      "break;"

lindex redisson_lock_queue:{anyLock} 0,就是从redisson_lock_queue:{anyLock}这个队列中弹出来第一个元素,刚开始,队列是空的,所以什么都获取不到,此时就会直接退出while true死循环

代码语言:javascript复制
1"if (redis.call('exists', KEYS[1]) == 0) and ((redis.call('exists', KEYS[2]) == 0) "
2  "or (redis.call('lindex', KEYS[2], 0) == ARGV[2])) then "  
3"redis.call('lpop', KEYS[2]); "  
4"redis.call('zrem', KEYS[3], ARGV[2]); "  
5"redis.call('hset', KEYS[1], ARGV[2], 1); "  
6"redis.call('pexpire', KEYS[1], ARGV[1]); "  
7"return nil; "  
8"end; "  

这段代码判断逻辑的意思是:

  1. exists anyLock,锁不存在,也就是没人加锁,刚开始确实是没人加锁的,这个条件肯定是成立的;
  2. 或者是exists redisson_lock_queue:{anyLock},这个队列不存在
  3. 或者是lindex redisson_lock_queue:{anyLock} 0,队列的第一个元素是UUID:threadId,或者是这个队列存在,但是排在队头的第一个元素,是当前这个线程

那么这个条件整体就可以成立了 anyLock和队列,都是不存在的,所以这个条件肯定会成立。接着执行if中的具体逻辑:

  • lpop redisson_lock_queue:{anyLock},弹出队列的第一个元素,现在队列是空的,所以什么都不会干
  • zrem redisson_lock_timeout:{anyLock} UUID:threadId,从set集合中删除threadId对应的元素,此时因为这个set集合是空的,所以什么都不会干
  • hset anyLock UUID:threadId_01 1,加锁成功: anyLock: { "UUID_01:threadId_01": 1 }
  • pexpire anyLock 30000,将这个锁key的生存时间设置为30000毫秒

返回一个nil,在外层代码中,就会认为是加锁成功,此时就会开启一个watchdog看门狗定时调度的程序,每隔10秒判断一下,当前这个线程是否还对这个锁key持有着锁,如果是,则刷新锁key的生存时间为30000毫秒 (看门狗的具体流程上一篇文章有讲述)

客户端B thread02 加锁分析

此时thread01 已经获取到了锁,如果thread02 在10:00:10分来执行加锁逻辑,具体的代码逻辑是怎样执行的呢?

代码语言:javascript复制
1"while true do "
2  "local firstThreadId2 = redis.call('lindex', KEYS[2], 0);"
3  "if firstThreadId2 == false then "
4      "break;"

进入while true死循环,lindex redisson_lock_queue:{anyLock} 0,获取队列的第一个元素,此时队列还是空的,所以获取到的是false,直接退出while true死循环

代码语言:javascript复制
1"if (redis.call('exists', KEYS[1]) == 0) and ((redis.call('exists', KEYS[2]) == 0) "
2  "or (redis.call('lindex', KEYS[2], 0) == ARGV[2])) then "  
3"redis.call('lpop', KEYS[2]); "  
4"redis.call('zrem', KEYS[3], ARGV[2]); "  
5"redis.call('hset', KEYS[1], ARGV[2], 1); "  
6"redis.call('pexpire', KEYS[1], ARGV[1]); "  
7"return nil; "  
8"end; "  

此时anyLock这个锁key已经存在了,说明已经有人加锁了,这个条件首先就肯定不成立了;

接着往下执行,看下另外的逻辑:

代码语言:javascript复制
1"if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then "  
2    "redis.call('hincrby', KEYS[1], ARGV[2], 1); "  
3    "redis.call('pexpire', KEYS[1], ARGV[1]); "  
4    "return nil; "  
5"end; "  

判断一下,此时这个第二个客户端是UUID_02,threadId_02,此时会判断一下,hexists anyLock UUID_02:threadId_02,判断一下在anyLock这个map中,是否存在UUID_02:threadId_02这个key?这个条件也不成立

继续执行后续代码:

代码语言:javascript复制
 1"local firstThreadId = redis.call('lindex', KEYS[2], 0); "  
 2"local ttl; "   
 3"if firstThreadId ~= false and firstThreadId ~= ARGV[2] then "   
 4    "ttl = tonumber(redis.call('zscore', KEYS[3], firstThreadId)) - tonumber(ARGV[4]);"   
 5"else "
 6    "ttl = redis.call('pttl', KEYS[1]);"   
 7"end; "   
 8
 9"local timeout = ttl   tonumber(ARGV[3]);"   
10"if redis.call('zadd', KEYS[3], timeout, ARGV[2]) == 1 then "  
11    "redis.call('rpush', KEYS[2], ARGV[2]);"  
12"end; "  
13"return ttl;", 

tonumber() 是lua中自带的函数,tonumber会尝试将它的参数转换为数字。

lindex redisson_lock_queue:{anyLock} 0,从队列中获取第一个元素,此时队列是空的,所以什么都不会有

因为我们是在10:00:10 分请求的,因为anyLock默认过期时间是30s,所以在thread02请求的时候ttl还剩下20s

ttl = pttl anyLock = 20000毫秒,获取anyLock剩余的生存时间,ttl假设这里就被设置为了20000毫秒

timeout = ttl 当前时间 5000毫秒 = 20000毫秒 10:00:00 5000毫秒 = 10:00:25

接着执行: zadd redisson_lock_timeout:{anyLock} 10:00:25 UUID_02:threadId_02

在set集合中插入一个元素,元素的值是UUID_02:threadId_02,他对应的分数是10:00:25(会用这个时间的long型的一个时间戳来表示这个时间,时间越靠后,时间戳就越大),sorted set,有序set集合,他会自动根据你插入的元素的分数从小到大来进行排序

继续执行: rpush redisson_lock_queue:{anyLock} UUID_02:theadId_02

这个指令就是将UUID_02:threadId_02,插入到队列的头部去

返回的是ttl,也就是anyLock剩余的生存时间,如果拿到的返回值是ttl是一个数字的话,那么此时客户端B而言就会进入一个while true的死循环,每隔一段时间都尝试去进行加锁,重新执行这段lua脚本

简单画图总结如下:

image.png

客户端C thread03 加锁分析

此时thread03 在10:00:15来加锁,分析一下执行原理:

代码语言:javascript复制
 1"while true do "
 2  "local firstThreadId2 = redis.call('lindex', KEYS[2], 0);"
 3  "if firstThreadId2 == false then "
 4      "break;"
 5  "end; "
 6  "local timeout = tonumber(redis.call('zscore', KEYS[3], firstThreadId2));"
 7  "if timeout <= tonumber(ARGV[4]) then "
 8      "redis.call('zrem', KEYS[3], firstThreadId2); "
 9      "redis.call('lpop', KEYS[2]); "
10  "else "
11      "break;"
12  "end; "
13  "end;"

while true死循环,lindex redisson_lock_queue:{anyLock} 0,获取队列中的第一个元素,UUID_02:threadId_02,代表的是这个客户端02正在队列里排队

zscore redisson_lock_timeout:{anyLock} UUID_02:threadId_02,从有序集合中获取UUID_02:threadId_02对应的分数,timeout = 10:00:25

判断:timeout <= 10:00:15?,这个条件不成立,退出死循环

代码语言:javascript复制
 1"local firstThreadId = redis.call('lindex', KEYS[2], 0); "  
 2"local ttl; "   
 3"if firstThreadId ~= false and firstThreadId ~= ARGV[2] then "   
 4    "ttl = tonumber(redis.call('zscore', KEYS[3], firstThreadId)) - tonumber(ARGV[4]);"   
 5"else "
 6    "ttl = redis.call('pttl', KEYS[1]);"   
 7"end; "   
 8
 9"local timeout = ttl   tonumber(ARGV[3]);"   
10"if redis.call('zadd', KEYS[3], timeout, ARGV[2]) == 1 then "  
11    "redis.call('rpush', KEYS[2], ARGV[2]);"  
12"end; "  
13"return ttl;", 

firstThreadId获取到的是队列中的第一个元素:UUID_02:thread_02

ttl = 10:00:25 - 10:00:15 = 5000毫秒 timeout = 5000毫秒 10:00:15 5000毫秒 = 10:00:30

将客户端C放入到对列和有序集合中: zadd redisson_lock_timeout:{anyLock} 10:00:30 UUID_03:threadId_03 rpush redisson_lock_queue:{anyLock} UUID_03:theadId_03

最终执行完后 如下图:

image.png

Redisson依次加锁逻辑

上面已经知道了,多个线程加锁过程中实际会进行排队,根据加锁的时间来作为获取锁的优先级,如果此时客户端A释放了锁,来看下客户端B、C是如果获取锁的

当客户端A释放锁 客户端B请求获取锁

直接看核心逻辑:

代码语言:javascript复制
1  "if (redis.call('exists', KEYS[1]) == 0) and ((redis.call('exists', KEYS[2]) == 0) "
2  "or (redis.call('lindex', KEYS[2], 0) == ARGV[2])) then "  
3"redis.call('lpop', KEYS[2]); "  
4"redis.call('zrem', KEYS[3], ARGV[2]); "  
5"redis.call('hset', KEYS[1], ARGV[2], 1); "  
6"redis.call('pexpire', KEYS[1], ARGV[1]); "  
7"return nil; "  
8"end; "  

if中的判断: exists anyLock 是否不存在,此时客户端A已经释放锁,所以这个条件成立。

然后判断队列不存在,或者队列中第一个元素为空,此时条件不成立,但是后面是or关联的判断,接着判断队列中的第一个元素是否为当前请求的UUID_02:threadId_02, 如果判断成功则开始加锁。

这里就是公平锁依次加锁的核心逻辑。

申明

本文章首发自本人博客:https://www.cnblogs.com/wang-meng 和公众号:壹枝花算不算浪漫,如若转载请标明来源!

0 人点赞