前言
代码死循环
这个话题,个人觉得还是挺有趣的。因为只要是开发人员,必定会踩过这个坑。如果真的没踩过,只能说明你代码写少了,或者是真正的大神。
尽管很多时候,我们在极力避免这类问题的发生,但有时候,死循环却悄咪咪的就来了,坑你于无形之中。如果你读完这篇文章,也许会对代码死循环问题有一些新的认识,学到一些非常实用的经验,少走一些弯路。
死循环的危害
让我们一起先来了解一下,代码死循环到底有哪些危害?
程序进入假死状态
: 当某个请求导致的死循环,该请求将会在很大的一段时间内,都无法获取接口的返回,程序好像进入假死状态一样。cpu使用率飙升
:代码出现死循环后,由于没有休眠,一直不断抢占cpu资源,导致cpu长时间处于繁忙状态,必定会使cpu使用率飙升。内存使用率飙升
:如果代码出现死循环时,循环体内有大量创建对象的逻辑,垃圾回收器无法及时回收,会导致内存使用率飙升。同时,如果垃圾回收器频繁回收对象,也会造成cpu使用率飙升问题。StackOverflowError
:在一些递归调用的场景,如果出现无限递归,最终会报StackOverflowError栈溢出,导致程序直接挂掉。
哪些场景会产生死循环?
1.一般循环遍历
这里说的一般循环遍历主要是指:
- for语句
- foreach语句
- while语句
这三种循环语句可能是我们平常使用最多的循环语句了,但是如果没有用好,也是最容易出现死循环的问题的地方。让我们一起看看,哪些情况会出现死循环。
1.1 条件恒等
很多时候我们使用for语句
循环遍历,不满足指定条件,程序会自动退出循环,比如:
for(int i=0; i<10; i ) {
System.out.println(i);
}
但是,如果不小心把条件写错了,变成这样的:
代码语言:javascript复制for(int i=0; i>10; i ) {
System.out.println(i);
}
结果就悲剧了,必定会出现死循环,因为循环中的条件变成恒等
的了。
很多朋友看到这里,心想这种错误我肯定不会犯的。不过我需要特别说明的是,这里举的例子相对来说比较简单,如果i>10
这里是个非常复杂的计算,还真说不准一定不会出现死循环。
1.2 不正确的continu
for语句
在循环遍历数组
和list
时更方便,而while语句
的使用场景却更多。
有时候,在使用while语句
遍历数据时,如果遇到特别的条件,需要用continue
关键字跳过本次循环,直接执行下次循环。
例如:
代码语言:javascript复制int count = 0;
while(count < 10) {
count ;
if(count == 4) {
continue;
}
System.out.println(count);
}
当count等于4时,不打印count。
但如果continue
没有被正确使用,可能会出现莫名奇怪的问题:
int count = 0;
while(count < 10) {
if(count == 4) {
continue;
}
System.out.println(count);
count ;
}
当count等于4时直接推出本次循环,count没有加1,而直接进入下次循环,下次循环时count依然等4,最后无限循环了。
这种是我们要千万小心的场景,说不定,已经进入了死循环你还不知道呢。
1.3 flag线程间不可见
有时候我们的代码需要一直做某件事情,直到某个条件达到时,有个状态告诉它,要终止任务了,它就会自动退出。
这时候,很多人都会想到用while(flag)
实现这个功能:
public class FlagTest {
private boolean flag = true;
public void setFlag(boolean flag) {
this.flag = flag;
}
public void fun() {
while (flag) {
}
System.out.println("done");
}
public static void main(String[] args) throws InterruptedException {
final FlagTest flagTest = new FlagTest();
new Thread(() -> flagTest.fun()).start();
Thread.sleep(200);
flagTest.setFlag(false);
}
}
这段代码在子线程中执行无限循环,当主线程休眠200毫秒后,将flag变成false,这时子线程就会自动退出了。想法是好的,但是实际上这段代码会进入死循环,不会因为flag变成false而自动退出。
为什么会这样?
线程间flag
是不可见的。
这时如果flag
加上了volatile
关键字:
private volatile boolean flag = true;
会强制把共享内存中的值刷新到主内存中,让多个线程间可见,程序可以正常退出。
2.Iterator遍历
除了前面介绍过的一般循环遍历
之外,遍历集合的元素,还可以使用Iterator遍历
。当然并非所有集合都能使用Iterator遍历
,只有实现了Iterator
接口的集合,或者该集合的内部类实现了Iterator
接口才可以。
例如:
代码语言:javascript复制public class IteratorTest {
public static void main(String[] args) {
List<String> list = new ArrayList<>();
list.add("123");
list.add("456");
list.add("789");
Iterator<String> iterator = list.iterator();
while(iterator.hasNext()) {
System.out.println(iterator.next());
}
}
}
但如果程序改成这样:
代码语言:javascript复制public class IteratorTest {
public static void main(String[] args) {
List<String> list = new ArrayList<>();
list.add("123");
list.add("456");
list.add("789");
while(list.iterator().hasNext()) {
System.out.println(list.iterator().next());
}
}
}
就会出现死循环。
这又是为什么呢?
如果看过ArrayList
源码的朋友,会发现它的底层iterator方法是这样的实现的:
public Iterator<E> iterator() {
return new Itr();
}
每次都new
了一个新的Itr
对象。而hasNext
方法的底层是通过判断游标和元素个数是否相等实现的:
public boolean hasNext() {
return cursor != size;
}
每次new
了一个新的Itr
对象的时候cursor
值是默认值0,肯定和元素个数不相等。所以导致while语句中的条件一直都成立,所以才会出现死循环。
❝我们都需要注意:在while循环中使用list.iterator().hasNext(),是个非常大的坑,千万小心。
3.类中使用自己的对象
有时候,在某个类中把自己的对象定义成成员变量,不知道你有没有这样做过。
有些可能会很诧异,为什么要这么做。
假如,你需要在一个方法中调用另一个打了@Transactional
注解的方法,这时如果直接方法调用,另外一个方法由于无法走代理事务会失效。比如:
@Service
public class ServiceA {
public void save(User user) {
System.out.println("业务处理");
doSave(user);
}
@Transactional(rollbackFor=Exception.class)
public void doSave(User user) {
System.out.println("保存数据");
}
}
这种场景事务会失效。
这时可以通过把该类自己定义成一个成员变量,通过该变量调用doSave方法就能有效的避免该问题。
代码语言:javascript复制@Service
public class ServiceA {
@Autowired
private ServiceA serviceA;
public void save(User user) {
System.out.println("业务处理");
serviceA.doSave(user);
}
@Transactional(rollbackFor=Exception.class)
public void doSave(User user) {
System.out.println("保存数据");
}
}
当然还有其他办法解决这个问题,不过这种方法是最简单的。其他的解决方案,可以看看我的另一篇文章《让人头痛的大事务问题到底要如何解决?》。
那么问题来了,如果成员变量不是通过@Autowired
注入,而是直接new
出来的,可以吗?
成员变量改成这样之后:
代码语言:javascript复制private ServiceA serviceA = new ServiceA();
项目重新启动,程序进入无限循环。不断创建ServiceA对象,但一直都无法成功,最后会报java.lang.StackOverflowError
栈溢出。当栈深度超过虚拟机分配给线程的栈大小时就会出现此错误。
为什么会出现这个问题?
因为程序在实例化ServiceA对象时,要先实例化它的成员变量serviceA,但是它的成员变量serviceA,又需要实例化它自己的成员变量serviceA,如此一层层实例化下去,最终也没能实例化。
而@Autowired
注入为什么没有问题?
因为@Autowired
是在ServiceA对象实例化成功之后,在依赖注入阶段,把实例注入到成员变量serviceA的。在spring中使用了三级缓存,通过提前暴露ObjectFactory
对象来解决这个自己依赖自己的循环依赖问题。
对spring循环依赖问题有兴趣的朋友,可以看看我之前写的一篇文章《spring:我是如何解决循环依赖的?》。
4.无限递归
在日常工作中,我们需要经常使用树形结构展示数据,比如:分类、地区、组织、菜单等功能。
很多时候需要从根节点遍历找到所有叶子节点,也需要从叶子节点,往上一直追溯到根节点。
我们以通过根节点遍历找到所有叶子节点为例。由于每次需要一层层遍历查找,而且调用的方法基本相同。为了简化代码,我们一般都会选择使用递归
来实现这个功能。
这里我们以根据叶子节点找到根节点为例,大致代码如下:
代码语言:javascript复制public Category findRoot(Long categoryId) {
Category category = categoryMapper.findCategoryById(categoryId);
if(null == category) {
throw new BusinessException("分类不存在");
}
Long parentId = category.getParentId();
if(null == categoryId || 0 == categoryId) {
return category;
}
return findRoot(parentId);
}
根据categoryId往上递归查找,如果发现parentId为null或者0的时候,就是根节点了,这时直接返回。
这可能是最普通不过的递归调用了,但是如果有人使坏,或者由于数据库误操作,把根节点的parentId改成了二级分类的categoryId一样,比如都改成:1222。这样递归调用会进入无限循环,最终会报java.lang.StackOverflowError
异常。
为了避免这种惨案的发生,推荐使用如下方法。
可以定义一个运行递归的最大层级MAX_LEVEL,达到了最大层级则直接退出。以上代码可以做如下调整:
代码语言:javascript复制private static final int MAX_LEVEL = 6;
public Category findRoot(Long categoryId, int level) {
if(level >= MAX_LEVEL) {
return null;
}
Category category = categoryMapper.findCategoryById(categoryId);
if(null == category) {
throw new BusinessException("分类不存在");
}
Long parentId = category.getParentId();
if(null == categoryId || 0 == categoryId) {
return category;
}
return findRoot(parentId, level);
}
先定义MAX_LEVEL的值,然后第一次调用递归方法的时候level字段的值传1,每递归一次level的值加1,当发现level的值大于等于MAX_LEVEL时,说明出现了异常情况,则直接返回null。
❝我们在写递归方法的时候,要养成好习惯,最好定义一个最大递归层级MAX_LEVEL,防止由于代码bug,或者数据异常,导致出现无限递归的情况。
5.hashmap
我们在写代码时,为了提高效率,使用集合的概率非常大。通常情况下,我们喜欢先把数据收集到集合当中,然后对数据进行批处理,比如批量insert或update,提升数据库操作的性能。
我们使用比较多的集合有:ArrayList、HashSet、HashMap等。我个人非常喜欢使用HashMap,特别是在java8中需要嵌套循环的地方,将其中一层循环的数据(list或者set)转换成HashMap,可以减少一层遍历,提升代码的执行效率。
但是如果HashMap使用不当,可能会出现死循环,怎么回事呢?
5.1 jdk1.7的HashMap
jdk1.7的HashMap中采用 数组
链表
的结构存储数据。在多线程环境下,同时往HaspMap中put数据时,会触发resize
方法中的transfer
方法,进行数据重新分配的过程,需要重新组织链表的数据。
由于采用了头插法
,最终会形成key3的next等于key7,而key7的next又等于key3的情况,从而构成了死循环。
5.2 jdk1.8的HashMap
有了解决jdk1.7扩容时出现死循环的问题,在jdk1.8中对HashMap进行了优化,将jdk1.7中的头插法
改成了尾插法
,另外采用 数组
链表
红黑树
的结构存储数据。如果链表中元素超过8个时,就将链表转化为红黑树,以减少查询的复杂度,将时间复杂度降低为O(logN)。
在多线程环境下,同时往HaspMap中put数据时,会触发root
方法重新组织树形结构的数据。
在for循环中会出现两个TreeNode节点的Parent引用都是对方,从而构成死循环的情况。
5.3 ConcurrentHashMap
由于在多线程环境下,使用无论是jdk1.7,还是jdk1.8的HashMap会有死循环的问题。所以很多人建议,不用在多线程环境下,使用HashMap
,而应该改用ConcurrentHashMap
。
ConcurrentHashMap
是线程安全的,同样采用了 数组
链表
红黑树
的结构存储数据,此外还是使用了 cas
分段锁
,默认是16段锁,保证并发写入时,数据不会产生错误。
在多线程环境下,同时往ConcurrentHashMap
中computeIfAbsent
数据时,如果里面还有一个computeIfAbsent,它们的key对应的hashCode是一样的,这时就会产生死循环。
意不意外,惊不惊喜?
幸好这个bug在jdk1.9中已经被Doug Lea修复了。
6.动态代理
我们在实际工作中,即使没有自己动手写过动态代理程序,但也听过或者接触过,因为很多优秀的开发框架,它们的底层必定都会使用动态代理,实现一些附加的功能。通常情况下,我们使用最多的动态代理是:JDK动态代理
和 Cglib
,spring的AOP就是通过这两种动态代理技术实现的。
我们在这里以JDK动态代理为例:
代码语言:javascript复制public interface IUser {
String add();
}
代码语言:javascript复制public class User implements IUser {
@Override
public String add() {
System.out.println("===add===");
return "success";
}
}
代码语言:javascript复制public class JdkProxy implements InvocationHandler {
private Object target;
public Object getProxy(Object target) {
this.target = target;
return Proxy.newProxyInstance(this.getClass().getClassLoader(),target.getClass().getInterfaces(),this);
}
@Override
public Object invoke(Object proxy, Method method, Object[] args) throws Throwable {
before();
Object result = method.invoke(target,args);
after();
return result;
}
private void before() {
System.out.println("===before===");
}
private void after() {
System.out.println("===after===");
}
}
代码语言:javascript复制public class Test {
public static void main(String[] args) {
User user = new User();
JdkProxy jdkProxy = new JdkProxy();
IUser proxy = (IUser)jdkProxy.getProxy(user);
proxy.add();
}
}
实现起来主要有三步:
- 实现某个具体业务
接口
- 实现
InvocationHandler
接口,创建调用关系 - 使用
Proxy
创建代理类,指定被代理类的相关信息
这样在调用proxy的add方式时,会自动调用before和after方法,实现了动态代理的效果,是不是很酷?
通常情况下,这种写法是没有问题的,但是如果在invoke
方法中调用了proxy
对象的toString
方法,加了这段代码:
proxy.toString();
程序再次运行,循环很多次之后,就会报java.lang.StackOverflowError
异常。
很多人看到这里可能一脸懵逼,到底发生了什么?
代理对象本身并没有自己的方法,它的所有方法都是基于被代理对象的。通常情况下,如果访问代理对象的方法,会经过拦截器的invoke
方法。但是如果在invoke
方法调了代理对象
的方法,比如:toString
方法,会经过另外一个拦截器的invoke
方法,如此一直反复调用,最终形成死循环。
❝切记不要在invoke方法中调用代理对象的方法,不然会产生死循环,坑你于无形之中。
7.我们自己写的死循环
很多朋友看到这个标题,可能会质疑,我们自己会写死循环?
没错,有些场景我们还真的会写。
7.1 定时任务
不知道你有没有手写过定时任务,反正我写过,是非常简单的那种(当然复杂的也写过,在这里就不讨论了)。如果有个需求要求每隔5分钟,从远程下载某个文件最新的版本,覆盖当前文件。
这时候,如果你不想用其他的定时任务框架,可以实现一个简单的定时任务,具体代码如下:
代码语言:javascript复制public static void downLoad() {
new Thread(() -> {
while (true) {
try {
System.out.println("download file");
Thread.sleep(1000 * 60 * 5);
} catch (Exception e) {
log.error(e);
}
}
}).start();
}
其实很多JDK
中的定时任务,比如:Timer
类的底层,也是用了while(true)的无限循环(也就是死循环)来实现的。
7.2 生产者消费者
不知道你有没有手写过生产者和消费者。假设有个需求需要把用户操作日志写入表中,但此时消费中还没有引入消息中间件,比如:kafka
等。
最常规的做法是在接口中同步把日志写入表中,保存逻辑跟业务逻辑可能在同一个事务中,但为了性能考虑,避免大事务的产生,一般建议不放在同一个事务。
原本挺好的,但是如果接口并发量
上来了,为了优化接口性能,可能会把同步写日志到表中的逻辑,拆分出来,做成异步处理的。
这时候,就可以手动撸一个生产者消费者解决这个问题了。
代码语言:javascript复制@Data
public class Car {
private Integer id;
private String name;
}
代码语言:javascript复制@Slf4j
public class Producer implements Runnable {
private final ArrayBlockingQueue<Car> queue;
public Producer(ArrayBlockingQueue<Car> queue) {
this.queue = queue;
}
@Override
public void run() {
int i = 1;
while (true) {
try {
Car car = new Car();
car.setId(i);
car.setName("汽车" i);
queue.put(car);
System.out.println("Producer:" car ", queueSize:" queue.size());
} catch (InterruptedException e) {
log.error(e.getMessage(),e);
}
i ;
}
}
}
代码语言:javascript复制@Slf4j
public class Consumer implements Runnable {
private final ArrayBlockingQueue<Car> queue;
public Consumer(ArrayBlockingQueue<Car> queue) {
this.queue = queue;
}
@Override
public void run() {
while (true) {
try {
Car car = queue.take();
System.out.println("Consumer:" car ",queueSize:" queue.size());
} catch (InterruptedException e) {
log.error(e.getMessage(), e);
}
}
}
}
代码语言:javascript复制public class ClientTest {
public static void main(String[] args) {
ArrayBlockingQueue<Car> queue = new ArrayBlockingQueue<Car>(20);
new Thread(new Producer(queue)).start();
new Thread(new Producer(queue)).start();
new Thread(new Consumer(queue)).start();
}
}
由于ArrayBlockingQueue
阻塞队列内部通过notEmpty
和 notFull
这两个Condition
实现了阻塞和唤醒机制,所以我们无需再做额外控制,用它实现生产者消费者相对来说要容易多了。
1.3 自己写的死循环要注意什么?
不知道聪明的小伙伴们有没有发现,我们自定义的定时任务
和生产者消费者
例子中,也写了死循环,但跟上面其他的例子都不一样,我们写的死循环没有出现问题,这是为什么?
定时任务
中我们用了sleep
方法做休眠:Thread.sleep(300000);
。
生产者消费者
用了Condition
类的await
和signal
方法实现了阻塞和唤醒机制。
这两种机制说白了,都会主动让出cpu一段时间,让其他的线程有机会使用cpu资源。这样cpu有上下文切换的过程,有一段时间是处于空闲状态的,不会像其他的列子中一直处于繁忙状态。其他的问题,比如内存使用率飙升问题,也会得到相应的缓解。
❝一直处于繁忙状态才是cpu使用率飙高的真正原因,我们要避免这种情况的产生。
就像我们平时骑共享单车(cpu资源)一样,我们一般骑1-2小时就会归还了,这样其他人就有机会使用这辆共享单车。但如果有个人,骑了一个天还没归还,那么这一天当中自行车一直处于繁忙之中,其他人就没有机会骑这辆自行车了。