Redisson杂谈

2023-10-18 11:14:55 浏览数 (2)

一.Redisson 简介

Redisson 是一个基于 Netty 通信框架的高性能 Redis 客户端, 实现了分布式和可扩展的 Java 数据结构,提供很多分布式相关操作服务以及大量便利的工具方法,让开发者可以把精力放在开发业务,避免重复造轮子。

二.Redisson 优点

1.通信框架基于 Netty,使用多路复用。吞吐量高。

2.兼容支持 Redis 集群模式,Reids 哨兵模式等,天然适配分布式服务。

3.提供多种分布式对象的封装,如:Bloom Filter,Object Bucket,Bitset,AtomicLong, 和 HyperLogLog 等。

4.提供分布式锁实现包括:

RedissonFairLock 公平锁,

RedissonLock 非公平锁,

RedissonRedLock 红锁(基于红锁算法, 当集群中大多数( N/2 1 )加锁成功了,则认为加锁成功,

目前已被弃用,Redisson 官方不再建议使用)。

三.RedissonLock 分布式锁相关部分源码解析

RedissonLock 作为分布式锁,实现了可重入锁。阻塞锁,非阻塞锁。并且 Redisson 存在看门狗机制,可以对未手动设置超时时间的锁实现自动续期。

1.Trylock 加锁

加锁代码逻辑

代码语言:javascript复制
/**
*
* @param waitTime 获取锁的最大等待时间,默认 -1,
* @param leaseTime 锁的过期时间,默认 -1
* @param unit
* @param threadId
* @return
*/
private RFuture<Boolean> tryAcquireOnceAsync(long waitTime, long leaseTime, TimeUnit unit, long threadId) {
  RFuture<Boolean> acquiredFuture;
  if (leaseTime > 0) {
    //若手动设置了锁的过期时间,则加锁时以当前传入过期时间为准
    //执行Lua脚本,加锁
    acquiredFuture = tryLockInnerAsync(waitTime, leaseTime, unit, 
    threadId,RedisCommands.EVAL_NULL_BOOLEAN);                                                 
  } else {
    //若未手动设置,则默认过期时间等于配置的lockWatchdogTimeout,lockWatchdogTimeout默认为30s。
    //然后执行Lua脚本,加锁
    acquiredFuture = tryLockInnerAsync(waitTime, internalLockLeaseTime,
    TimeUnit.MILLISECONDS, threadId, RedisCommands.EVAL_NULL_BOOLEAN);
  }

  CompletionStage<Boolean> f = acquiredFuture.thenApply(acquired -> {
  //lock acquired
  //若锁成功获取到
  if (acquired) {
    if (leaseTime > 0) {
      internalLockLeaseTime = unit.toMillis(leaseTime);
      } else {
      //若未手动设置过期时间,则执行看门狗任务,自动续期
      scheduleExpirationRenewal(threadId);
    }
  }
  return acquired;
  });
  return new CompletableFutureWrapper<>(f);
}

加锁 Lua 脚本如下:

代码语言:javascript复制
if (redis.call('exists', KEYS[1]) == 0) then "  
  "redis.call('hincrby', KEYS[1], ARGV[2], 1); "  
  "redis.call('pexpire', KEYS[1], ARGV[1]); "  
  "return nil; "  
  "end; "  
  "if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then "  
  "redis.call('hincrby', KEYS[1], ARGV[2], 1); "  
  "redis.call('pexpire', KEYS[1], ARGV[1]); "  
  "return nil; "  
  "end; "  
  "return redis.call('pttl', KEYS[1]);

其中 KEYS[1] 是锁逻辑名称,ARGV[1] 是 key 的过期时间,ARGV[2]是锁的线程级别名称( uuid 线程id ,uuid 是每个 Redisson 客户端创建时唯一生成的)。

由此可看出,锁利用 Hash 结构实现,其中 Hash 的 key 是锁的逻辑名称,field 是锁的线程级别名称,value 是锁的重入次数。

加锁 Lua 脚本的含义:

先判断当前逻辑锁名称的 key 是否存在,

若不存在,在 Hash 结构中设置这个锁,锁重入次数加 1,然后给 key 设置一个过期时间,最后返回 null。

若存在,并且已经被当前线程持有,就锁可重入次数加 1,并且重新设置 key 的过期时间,最后返回 null,

若当前锁被其他线程持有,返回 key 剩余过期时间。

2.Lock 阻塞锁

Lock 阻塞锁与 Trylock 底层调用代码基本一致。多了一个等待锁被其他线程释放后,重新尝试加锁的过程。

代码如下:

代码语言:javascript复制
private void lock(long leaseTime, TimeUnit unit, boolean interruptibly) throws InterruptedException {
  long threadId = Thread.currentThread().getId();
  Long ttl = tryAcquire(-1, leaseTime, unit, threadId);
  // lock acquired
  if (ttl == null) {
    return;
  }
  //订阅释放锁消息
  CompletableFuture<RedissonLockEntry> future = subscribe(threadId);
  pubSub.timeout(future);
  RedissonLockEntry entry;
  if (interruptibly) {
    entry = commandExecutor.getInterrupted(future);
  } else {
    entry = commandExecutor.get(future);
  }

  try {
    while (true) {
      //重新尝试取锁
      ttl = tryAcquire(-1, leaseTime, unit, threadId);
      // lock acquired
      if (ttl == null) {
        break;
      }
      // waiting for message,
      if (ttl >= 0) {
        try {
          //当锁仍然被其他线程占有时,调用
          //java.util.concurrent.Semaphore#tryAcquire方法进行信号量阻塞,
          //当线程阻塞等待时间超过最大超时时间(ttl即锁的key的剩余存活时间)
          //或者 监听到锁释放消息后,信号量被释放后,线程不再阻塞
          entry.getLatch().tryAcquire(ttl, TimeUnit.MILLISECONDS);
        } catch (InterruptedException e) {
          if (interruptibly) {
            throw e;
          }
          entry.getLatch().tryAcquire(ttl, TimeUnit.MILLISECONDS);
        }
      } else {
        if (interruptibly) {
          //尝试从信号量获取一个许可
          entry.getLatch().acquire();
        } else {
          entry.getLatch().acquireUninterruptibly();
        }
      }
    }
  } finally {
  //取消订阅锁释放消息
  unsubscribe(entry, threadId);
}

大致流程如下:

1.先获取锁,若获取锁成功,直接返回。

2.若获取失败,订阅释放锁消息。

3.进入 while 循环,重新尝试获取锁。若获取锁成功,则跳出循环,并不再订阅释放锁消息。

4.若重新获取锁失败,进行信号量阻塞,直到锁被其他占有线程释放(监听锁释放消息的监听器中,有唤醒信号量的逻辑)或者到达阻塞超时时间,然后继续这个 while 循环。

3.Unlock 解锁

代码如下

代码语言:javascript复制
public RFuture<Void> unlockAsync(long threadId) {
  //执行解锁lua脚本
  RFuture<Boolean> future = unlockInnerAsync(threadId);

  CompletionStage<Void> f = future.handle((opStatus, e) -> {
    //取消看门狗任务
    cancelExpirationRenewal(threadId);

    if (e != null) {
      throw new CompletionException(e);
    }
    if (opStatus == null) {
      IllegalMonitorStateException cause = new IllegalMonitorStateException
      ("attempt to unlock lock, not locked by current thread by node id: "
        id   " thread-id: "   threadId);
      throw new CompletionException(cause);
    }
    return null;
  });

  return new CompletableFutureWrapper<>(f);
}

1.其中解锁 Lua 脚本如下:

代码语言:javascript复制
if (redis.call('hexists', KEYS[1], ARGV[3]) == 0) then "  
  "return nil;"  
  "end; "  
  "local counter = redis.call('hincrby', KEYS[1], ARGV[3], -1); "  
  "if (counter > 0) then "  
  "redis.call('pexpire', KEYS[1], ARGV[2]); "  
  "return 0; "  
  "else "  
  "redis.call('del', KEYS[1]); "  
  "redis.call('publish', KEYS[2], ARGV[1]); "  
  "return 1; "  
  "end; "  
  "return nil;

其中 KEYS[1] 为锁的逻辑名称,KEYS[2] 为通道名称,ARGV[1] 为 0, ARGV[2] 为锁的过期时间,默认 30s,ARGV[3] 为锁的线程级别名称。

解锁 Lua 脚本含义:

解锁时,先判断当前锁是否被当前线程持有,

若不是,则返回 null。

若是,锁的可重入次数 减1。

然后继续判断锁的可重入次数是否大于 0,若大于 0,继续给这个锁 key 续期 30s,并且最后返回 0。

若不大于 0,删除这个锁的 key,并向指定通道发布这个解锁消息,并且返回 1。

2.如果这个锁有看门狗任务在定时续期,当解锁成功时会取消这个定时续期任务。

4.看门狗机制

当某个锁内的任务的执行时间不可预估时,可能执行时间很长,也可能很短。此时若直接设置一个固定的锁过期时间,可能会导致任务执行时间远远大于锁的过期时间,导致任务还未执行完成,但是锁已经过期了。那其他线程又可以获取到锁,然后执行该任务了,最终导致线程安全问题。

为应对这种情况,定期给锁续期的看门狗机制出现了。

代码:

代码语言:javascript复制
//真正看门狗续期任务
private void renewExpiration() {
  ExpirationEntry ee = EXPIRATION_RENEWAL_MAP.get(getEntryName());
  if (ee == null) {
    return;
  }
  //创建一个延时任务,底层实现是netty时间轮。当每过了lockWatchdogTimeout/3的时间,执行该任务
  Timeout task = commandExecutor.getConnectionManager().newTimeout(new TimerTask() {
    @Override
    public void run(Timeout timeout) throws Exception {
      ExpirationEntry ent = EXPIRATION_RENEWAL_MAP.get(getEntryName());
        if (ent == null) {
          return;
        }
        Long threadId = ent.getFirstThreadId();
        //若当前锁已经被当前线程释放,则锁不再续期
        if (threadId == null) {
          return;
        }
        //调用Lua脚本,判断当前锁是否被当前线程占有,若是则返回true,
        //并且重新设置key的过期时间,默认30s
        CompletionStage<Boolean> future = renewExpirationAsync(threadId);
        future.whenComplete((res, e) -> {
          if (e != null) {
            log.error("Can't update lock "   getRawName()   " expiration", e);
            EXPIRATION_RENEWAL_MAP.remove(getEntryName());
            return;
            }
            //当锁仍然被当前线程占有,说明业务代码还在执行,则递归调用续期任务
            if (res) {
              // reschedule itself
              log.info("续期任务执行"  "threadId:"  threadId);
              renewExpiration();
            } else {
              //否则移除该续期任务,直接在EXPIRATION_RENEWAL_MAP移除ExpirationEntry
              cancelExpirationRenewal(null);
            }
        });
    }
  }, internalLockLeaseTime / 3, TimeUnit.MILLISECONDS);
  
  ee.setTimeout(task);
}

当没有显式指定锁过期时间时候,就默认 key 过期时间 30s,然后定时任务每 10 秒( lockWatchdogTimeout/3 )进行一次调用,执行锁续期动作,若这个线程还持有这个锁,就对这个线程持有的锁进行续期操作(通过 pexpire 续期 key 30s),若途中持有锁的线程 手动被 unlock 或者机器宕机才会取消这个任务。否则会一直续期。

四.总结

Redisson 作为一个 Redis 客户端,基于 Redis、Lua 和 Netty 建立起了一套完善的分布式解决方案,比如分布式锁的实现,分布式对象的操作等。本文主要简单讲述了在 Redisson 中分布式锁的实现。其实在 Redisson 中还有很多值得深挖的点。比如:Redisson 中使用了大量 Netty 的特性。大家有兴趣的话,可以仔细研究一下。

五.参考文章

https://github.com/redisson/redisson/wiki

https://cloud.tencent.com/developer/article/1500854

0 人点赞