forkjoin并发分页查数据_java fork join

2022-11-04 16:07:52 浏览数 (1)

大家好,又见面了,我是你们的朋友全栈君。

为什么用 Fork/Join ?

对于简单的并行任务,你可以通过“线程池 Future”的方案来解决;如果任务之间有聚合关系,无论是AND聚合还是OR聚合,都可以通过CompletableFuture来解决;而批量的并行任务,则可以通过CompletionService来解决。这几种方案基本上能够覆盖日常工作中的并发场景了,但还是不够全面,因为还有一种“分治”的任务模型没有覆盖到。

分治,顾名思义,即分而治之,是一种解决复杂问题的思维方法和模式;具体来讲,指的是把一个复杂的问题分解成多个相似的子问题,然后再把子问题分 解成更小的子问题,直到子问题简单到可以直接求解。

Java并发包里提供了一种叫做Fork/Join的并行计算框架,就是用来支持分治这种任务模型的。

如何用Fork/Join 并行计算框架计算斐波那契数列

f(n)=f(n-1) f(n-2)

代码语言:javascript复制
import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.RecursiveTask;
public class forkjoin {
    public static void main(String[] args) {
        //创建分治任务线程池
        ForkJoinPool fjp = new	ForkJoinPool(4);
        //创建分治任务
        Fibonacci fib = new	Fibonacci(30);
        //启动分治任务
        Long start_time = System.currentTimeMillis();
        Integer	result = fjp.invoke(fib);
        //输出结果
        Long end_time = System.currentTimeMillis();
        Long compute_time = end_time - start_time;
        System.out.println("result: " result);
        System.out.println("forkjoin compute_time: "  compute_time);
    }
    //递归任务
    static class Fibonacci extends RecursiveTask<Integer>{
        final	int	n;
        Fibonacci(int	n){this.n	=	n;}
        protected	Integer	compute(){
            if(n<=1) 
                return n;
            Fibonacci f1 = new Fibonacci(n-1);
            //创建⼦任务
            f1.fork();
            Fibonacci f2 = new Fibonacci(n-2);
            //等待⼦任务结果,并合并结果
            return f2.compute() f1.join();
        }
    }
}

普通单线程计算斐波那契数列

代码语言:javascript复制
public class fibonacci {
    public static void main(String[] args) {
        Fibonacci fib = new	Fibonacci(30);
        Long start_time = System.currentTimeMillis();
        Integer	result = fib.compute();
        Long end_time = System.currentTimeMillis();
        Long compute_time = end_time - start_time;
        System.out.println("result: " result);
        System.out.println("compute_time: "  compute_time);
    }
    //递归任务
    static class Fibonacci {
        final int n;
        Fibonacci(int n){
            this.n = n;
        }
        protected	Integer	compute(){
            //终止条件
            if(n<=1)
                return	n;
            //创建⼦任务
            Fibonacci f1 = new	Fibonacci(n-1);
            Fibonacci f2 = new	Fibonacci(n-2);
            //等待⼦任务结果,并合并结果
            return f2.compute() f1.compute();
        }
    }
}

分别执行,会发现普通计算的方式会更快,说明forkjoin在调度方面会有很大的性能消耗。

在终止条件下加上一条休眠语句,使每次计算都要持续设定时间以上,再对比两种方式的速度。

代码语言:javascript复制
 Fibonacci fib = new	Fibonacci(5);

 //终止条件
if(n<=1) {
    if(n<=1) {
         try {
              Thread.sleep(1000);
         }catch (Exception e){
              e.printStackTrace();
         }
         return n;
     }
}

可以发现并行的计算方式的执行速度,与设定的的线程数量有关,比如第五个斐波那契数列的值,需要分解为8次计算任务,每次至少需要8秒。普通计算方式需要8秒,并行计算方式在线程数为4的情况下,执行时间为2秒;线程数为8的情况下,执行时间为1秒。实际执行速度应与CPU的核数有关,即如果CPU只有4核,就算设置为8线程,最快速度也只有2秒(示例中执行时间为1秒是因为采用线程休眠来模拟该线程的总处理时间,实际该线程在休眠期间并不消耗计算资源)

使用Fork/Join需要注意的地方

在使用Fork/Join时,需要注意出现工作线程不工作的事情。下面从不同的使用方式来分析: fork() 和 compute()

在示例中,下面这句语句是分解任务以及合并任务的关键

代码语言:javascript复制
 f1.fork();
//等待⼦任务结果,并合并结果
return f2.compute() f1.join();

主线程分配了一个任务给子线程,同时自己也执行一次计算任务。

方式1: a.fork(); b.fork(); b.join(); a.join();

代码语言:javascript复制
f1.fork();
f2.fork();
return f2.join() f1.join();

这种使用方式内部做了很多优化,目的都是为了避免出现工作线程只分配任务而不执行任务的情况。

方式2:invokeAll(a,b)

代码语言:javascript复制
invokeAll(f1, f2);
return f2.join() f1.join();

invokeAll的N个任务中,其中N-1个任务会使用fork()交给其它线程执行,但是,它还会留一个任务自己执行,这样,就充分利用了线程池,保证没有空闲的不干活的线程。

方式3:a.fork(); b.fork(); a.join(); b.join(); (错误的使用方式,不建议使用)

代码语言:javascript复制
f1.fork();
f2.fork();
return f1.join() f2.join();

这种使用方式会出现工作线程只分配任务给子线程,自己却不执行任务的情况。比如某个任务可以分为四个子任务,线程a把任务分给线程b线程c,而线程b线程c又继续分给自己的子线程(b分解为b1和b2 / c分解为c1和c2),总共需要7个线程,但是abc却不参与计算。而第一种使用方法,Java内部做了优化。

总结

用两次fork()在join的时候,需要用这样的顺序:a.fork(); b.fork(); b.join(); a.join();这个要求在JDK官方文档里有说明。

建议使用fork() 和 compute() ,这样可以避免避免性能问题,且更容易理解。该用法可理解为在主线程中使用fork分解一次任务,同时该线程执行一次compute 计算,如果该compute计算还需要分解任务,则继续fork() 和 compute(),直到满足终止条件直接返回。因此主线程会不断分解任务,直到任务无法分解并计算该任务返回计算结果。即主线程的处理任务是分解n/2 次任务以及执行一次无法分解的任务。

参考 :

https://www.liaoxuefeng.com/article/001493522711597674607c7f4f346628a76145477e2ff82000

https://time.geekbang.org/discuss/detail/90130/

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

0 人点赞