认识线程死锁
多个线程同时被阻塞,他们中的一个或者全部都在等待某个资源被释放。由于线程被无限期地阻塞,因此程序不可能正常终止,最终导致死锁产生。
如下图所示,线程 A 持有资源 2,线程 B 持有资源 1,他们同时都想申请对方的资源,所以这两个线程就会因互相等待而进入死锁状态。
线程死锁示意图
下面通过一个例子来说明线程死锁,代码模拟了上图的死锁情况 (源于《并发编程之美》):
代码语言:javascript复制public class DeadLockDemo {
private static Object resource1 = new Object();//资源 1
private static Object resource2 = new Object();//资源 2
public static void main(String[] args) {
new Thread(() -> {
synchronized (resource1) {
System.out.println(Thread.currentThread() "get resource1");
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println(Thread.currentThread() "waiting get resource2");
synchronized (resource2) {
System.out.println(Thread.currentThread() "get resource2");
}
}
}, "线程 1").start();
new Thread(() -> {
synchronized (resource2) {
System.out.println(Thread.currentThread() "get resource2");
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println(Thread.currentThread() "waiting get resource1");
synchronized (resource1) {
System.out.println(Thread.currentThread() "get resource1");
}
}
}, "线程 2").start();
}
}
Output:
代码语言:javascript复制Thread[线程 1,5,main]get resource1
Thread[线程 2,5,main]get resource2
Thread[线程 1,5,main]waiting get resource2
Thread[线程 2,5,main]waiting get resource1
线程 A 通过 synchronized (resource1) 获得 resource1 的监视器锁,然后执行 Thread.sleep(1000);
,让线程 A 休眠 1s 是为了让线程 B 得到执行,然后获取到 resource2 的监视器锁。线程 A 和线程 B 休眠结束后,都开始企图请求对方获取到的资源,然后这两个线程就会陷入互相等待的状态,这也就产生了死锁。上面的例子同时符合产生死锁的四个必要条件:
学过操作系统的朋友都知道,产生死锁必须具备以下四个条件:
- 互斥条件:该资源任意一个时刻只由一个线程占用;
- 请求与保持条件:一个进程因请求资源而阻塞时,对已获得的资源持有不释放;
- 不剥夺条件:线程已获得的资源,在末使用完之前不能被其他线程强行剥夺,只有自己使用完毕后才释放资源;
- 循环等待条件:若干进程之间形成一种头尾相接的循环等待资源关系。
如何避免线程死锁
同理,只要任意破坏产生死锁的四个条件中的其中一个就可以了:
1. 破坏互斥条件
该条件没有办法破坏,因为用锁的意义本来就是想让他们互斥的(临界资源需要互斥访问);
2. 破坏请求与保持条件
一次性申请所有的资源;
3. 破坏不剥夺条件
占用部分资源的线程进一步申请其他资源时,如果申请不到,可以主动释放它占有的资源;
4. 破坏循环等待条件
靠按序申请资源来预防。按某一顺序申请资源,释放资源则反序释放。
对线程 2 的代码修改成下面这样,就不会产生死锁了:
代码语言:javascript复制 new Thread(() -> {
synchronized (resource1) {
System.out.println(Thread.currentThread() "get resource1");
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println(Thread.currentThread() "waiting get resource2");
synchronized (resource2) {
System.out.println(Thread.currentThread() "get resource2");
}
}
}, "线程 2").start();
Output:
代码语言:javascript复制Thread[线程 1,5,main]get resource1
Thread[线程 1,5,main]waiting get resource2
Thread[线程 1,5,main]get resource2
Thread[线程 2,5,main]get resource1
Thread[线程 2,5,main]waiting get resource2
Thread[线程 2,5,main]get resource2
Process finished with exit code 0
我们分析一下上面的代码为什么能避免死锁的发生?
线程 1 首先获取得到 resource1 的监视器锁,这时候线程 2 就获取不到了;然后线程 1 再去获取 resource2 的监视器锁,可以获取到;再然后线程 1 释放了对 resource1、resource2 的监视器锁的占用,线程 2 获取到就可以执行了;这样就破坏了循环等待条件,因此避免了死锁。