1、介绍
Fork/Join 框架是 Java7 提供了的一个用于并行执行任务的框架, 是一个把大任务分割成若干个小任务,最终汇总每个小任务结果后得到大任务结果的框架。在多核计算机中正确使用可以很好的发挥cpu的作用,提高程序的执行效率。框架采用工作窃取算法,当有子任务线程处理完当前任务时,它会从其他线程执行的任务队列里窃取任务来执行,从而提高整体的执行效率。为了减少线程间的任务资源竞争,队列通常使用双端队列,别窃取任务线程永远从啥UN广大UN队列的呕吐不获取任务执行,而窃取任务的线程永远从双端队列的尾部获取任务执行。
2、使用
根据业务场景来考虑是否需要使用Fork/Join框架来进行任务的拆分和汇总操作。当需要时,比如说需要执行一个很大的业务计算之类的,此时使用Fork/Join框架分以下两步:
- 对任务进行分割 把大任务分割成子任务,有可能子任务还是很大,所以还需要不停的分割,直到分割出的子任务足够小
- 执行分割的子任务并汇总结果 分割的子任务分别放在双端队列里,然后几个启动线程分别从双端队列里获取任务执行。子任务执行完的结果都统一放在一个队列里,启动一个线程从队列里拿数据,然后合并这些数据
具体实现以上两步:
- 创建ForkJoinTask 它提供在任务中执行 fork() 和 join() 操作的机制,通常情况下我们不需要直接继承 ForkJoinTask 类,而只需要继承它的子类,Fork/Join 框架提供了以下两个子类: RecursiveAction:用于没有返回结果的任务 RecursiveTask :用于有返回结果的任务
- 使用ForkJoinPool执行ForkJoinTask 任务分割出的子任务会添加到当前工作线程所维护的双端队列中,进入队列的头部。当一个工作线程的队列里暂时没有任务时,它会随机从其他工作线程的队列的尾部获取一个任务
3、示例
3.1 使用fork
public class SumTask extends RecursiveTask <Integer>{
private static final Integer THRESHOLD = 1000;
private int start;
private int end;
public SumTask(int start, int end) {
this.start = start;
this.end = end;
}
@Override
protected Integer compute() {
Integer sum = 0;
boolean isOk = (end - start) <= THRESHOLD;
if(isOk) {
for(int i = start; i <= end; i ++) {
sum += i;
}
return sum;
}
int middle = (end + start) / 2;
//子任务递归
SumTask sumSubTask = new SumTask(start, middle);
SumTask sumSubTask1 = new SumTask(middle + 1, end);
//fork子任务
sumSubTask.fork();
sumSubTask1.fork();
//join子任务
Integer join = sumSubTask.join();
Integer join1 = sumSubTask1.join();
sum = join + join1;
//计算结果
return sum;
}
}
3.2 使用invokeAll
public class SumTask2 extends RecursiveTask <Integer>{
private static final Integer THRESHOLD = 1000;
private int start;
private int end;
public SumTask2(int start, int end) {
this.start = start;
this.end = end;
}
@Override
protected Integer compute() {
Integer sum = 0;
boolean isOk = end - start <= THRESHOLD;
if(isOk) {
for(int i = start; i <= end; i ++) {
sum += i;
}
// System.out.println(String.format("compute %d-%d = %d", start, end, sum));
return sum;
}
//除以2
int middle = (end + start) / 2;
//子任务递归
// System.out.println(String.format("fork %d-%d => %d-%d&%d-%d", start, end, start, middle - 1, middle, end));
SumTask2 sumSubTask = new SumTask2(start, middle - 1);
SumTask2 sumSubTask1 = new SumTask2(middle, end);
//fork子任务
invokeAll(sumSubTask, sumSubTask1);
//join子任务
Integer join = sumSubTask.join();
Integer join1 = sumSubTask1.join();
sum = join + join1;
//计算结果
return sum;
}
}
测试
ForkJoinPool fjp2 = new ForkJoinPool();
SumTask2 sumTask2 = new SumTask2(start, end);
long begin3 = System.currentTimeMillis();
Integer invoke = fjp2.invoke(sumTask2);
long end3 = System.currentTimeMillis();
System.out.println("计算结果3为 sum = " + invoke + ",计算时长为" + begin3 + "-" + end3 + "--- " + (end3 - begin3) + "ms");
ForkJoinPool fjp = new ForkJoinPool();
long begin2 = System.currentTimeMillis();
SumTask sumTask = new SumTask(start, end);
ForkJoinTask<Integer> submit = fjp.submit(sumTask);
Integer join = submit.join();
long end2 = System.currentTimeMillis();
System.out.println("计算结果2为 sum = " + join + ",计算时长为" + begin2 + "-" + end2 + "--- " + (end2 - begin2) + "ms");
结果
从结果(可以多次运行测试)可以看出,使用invokeAll方式效率比使用单独fork方式高,所以在使用时尽量采用invokeAll方式,这样可以充分利用线程池中的线程去执行任务。