Semaphore:实现一个限流器
Semaphore
现在普遍翻译成 "信号量",从概念上讲信号量维护着一组 "凭证",获取到凭证的线程才能访问资源,使用完成后释放, 我们可以使用信号量来限制访问特定资源的并发线程数。
就像现实生活中的停车场车位,当有空位的时候才能放车子进入,不然就只能等待,出来的车子则释放凭证。
信号量模型
可以简单的概括为:一个计数器、一个等待队列、三个方法。 在信号量模型里,计数器和等待队列对外是透明的,只能通过信号量模型提供的三个方法访问它们,init()、acquire()、release()
。
- init(): 设置计数器的初始值,初始化凭证数量。可以理解为停车场的车位数量。
- acquire():计数器的值减 1 ;如果此时计数器的值小于 0,则当前线程将被阻塞,放到等待队列之中,否则当前线程可以继续执行。
- release():计数器值加 1;如果此时计数器的值小于或者等于 0,则唤醒等待队列中的一个线程,并将其从等待队列中移除。
这里提到的 init()、acquire()、release()
三个方法都是原子性的,并且这个原子性是由信号量模型的实现方保证的。在 Java SDK 里面,信号量模型是由 java.util.concurrent.Semaphore
实现的,Semaphore 这个类能够保证这三个方法都是原子操作。
通过一个简化版的信号模型代码便于理解:
代码语言:javascript复制public class Semaphore {
//计数器
private int count;
//保存线程的等待队列
private Queue queue;
/**
* 初始化计数器
* @param count
*/
public Semaphore(int count) {
this.count = count;
}
/**
* 获取凭证
*/
public void acquire(){
this.count--;
if(this.count<0){
// 将当前线程插入等待队列
// 阻塞当前线程
}
}
/**
* 释放凭证
*/
public void release(){
this.count ;
if(this.count >= 0) {
// 移除等待队列中的某个线程 T
// 唤醒线程 T
}
}
}
信号量的使用
通过上文我们了解到信号量模型原理,接下来则看如何在实际场景中使用。这里我们还是用累加器的例子来说明信号量的使用吧。在累加器的例子里面,count
操作是个临界区,只允许一个线程执行,也就是说要保证互斥。
public class TestSemaPhore {
private static int count;
//初始化信号量为 1
private static final Semaphore semaphore = new Semaphore(1);
public static void addOne() throws InterruptedException {
//使用信号量保证互斥,只有一个线程进入
semaphore.acquire();
try {
count ;
} finally {
semaphore.release();
}
}
public static int getCount() {
return count;
}
public static void main(String[] args) throws InterruptedException {
//模拟十个线程同时访问
CountDownLatch countDownLatch = new CountDownLatch(1);
for (int i = 0; i < 10; i ) {
new Thread(() -> {
try {
addOne();
countDownLatch.await();
} catch (InterruptedException e) {
e.printStackTrace();
}
}).start();
}
countDownLatch.countDown();
TimeUnit.SECONDS.sleep(3);
int count = getCount();
System.out.println(count);
}
}
我们来分析下信号量如何保证互斥的。
假设两个线程 T1 和 T2 同时访问 addOne()
,当他们都调用semaphore.acquire();
的时候,由于这是一个原子操作,所以只有一个线程能把信号量计数器减为 0,另外一个线程 T2 则是将计数器减为 -1。对应线程 T1 计数器的值为 0 ,满足大于等于 0,所以线程 T1 会继续执行;对于线程 T2,信号量计数器的值为 -1,小于 0 ,按照我们之前的信号量模型 acquire()
描述,线程 T2 将被阻塞进入等待队列。所以此刻只有线程 T1 进入临界区执行 count
。
当前信号量计数器的值为 -1 ,当线程 T1 执行 semaphore.release()
操作执行完后 计数器 1 则变成了 0,满足小于等于 0,按照模型的定义,此刻等待队列中的 T2 将会被唤醒,于是 T2 在 T1 执行完临界区代码后才获得进入代码临界区的机会,从而保证了互斥性。
实现一个限流器
上面的例子我们利用信号量实现了一个简单的互斥锁,你会不会觉得奇怪,既然 Java SDK 里面提供了 Lock,为啥还要提供一个 Semaphore ?其实 Semaphore 还有一个功能是 Lock 不容易实现的,那就是:Semaphore 可以允许多个线程访问一个临界区。
常见的就是池化资源,比如连接池、对象池、线程池等。比如熟悉的数据库连接池,在同一时刻允许多个线程同时使用连接,当然在每个连接被释放之前,是允许其他线程使用的。
现在我们假设有一个场景,对象池需求,就是一次性创建 N 个对象,之后所有的线程都复用这 N 个对象,在对象被释放前,是不允许其他线程使用。
代码语言:javascript复制/**
* 对象池
*
*/
public class ObjectPool {
//使用 阻塞队列保存对象池
private final ArrayBlockingQueue<InputSaleMapDO> pool;
//信号量
private final Semaphore sem;
/**
* 初始化对象池
*
* @param size 池大小
*/
public ObjectPool(int size) {
pool = new ArrayBlockingQueue<>(size);
sem = new Semaphore(size);
for (int i = 0; i < size; i ) {
InputSaleMapDO inputSaleMapDO = new InputSaleMapDO();
inputSaleMapDO.setId((long) i);
pool.add(inputSaleMapDO);
}
}
//利用对象池的对象调用 function
public Long run(Function<InputSaleMapDO, Long> function) throws InterruptedException {
InputSaleMapDO obj = null;
sem.acquire();
try {
obj = pool.poll();
return function.apply(obj);
} finally {
pool.add(obj);
sem.release();
}
}
public static void main(String[] args) throws InterruptedException {
ObjectPool objectPool = new ObjectPool(2);
//模拟十个线程同时访问
CountDownLatch countDownLatch = new CountDownLatch(1);
for (int i = 0; i < 10; i ) {
new Thread(() -> {
try {
objectPool.run(f -> {
System.out.println(f);
return f.getId();
});
countDownLatch.await();
} catch (InterruptedException e) {
e.printStackTrace();
}
}).start();
}
countDownLatch.countDown();
TimeUnit.SECONDS.sleep(30);
}
}
初始化线程池大小 2 ,我们模拟 10 个线程,每次只能两个线程分配对象 InputSaleMapDO。
执行完回调函数之后,它们就会释放对象(这个释放工作是通过 pool.add(obj) 实现的),同时调用 release() 方法来更新信号量的计数器。如果此时信号量里计数器的值小于等于 0,那么说明有线程在等待,此时会自动唤醒等待的线程。
思考
上面的例子中 保存对象池使用了 ArrayBlockingQueue ,是一个线程安全的容器,那么是否可以换成 ArrayList?欢迎后台给出答案。还有假设是停车场的车位作为对象池,车主停车是不是也可以使用 Semaphore 实现?