java并发编程（十八）----(线程池)java线程池框架Fork-Join

还记得我们在初始介绍线程池的时候提到了Executor框架的体系，到现在为止我们只有一个没有介绍，与ThreadPoolExecutor一样继承与AbstractExecutorService的ForkJoinPool.Fork/Join框架是Java7提供了的一个用于并行执行任务的框架，是一个把大任务分割成若干个小任务，最终汇总每个小任务结果后得到大任务结果的框架。

我们通过表面的意思去理解ForkJoin框架：Fork即把一个大任务切割成若干部分并行执行，join即把这些被切分的任务的执行结果合并一起汇总，我们可以用下图来表示：

Fork / Join的逻辑很简单：

（1）将每个大任务分离（fork）为较小的任务; 
（2）在单独的线程中处理每个任务（如果必要，将它们分离成更小的任务）; 
（3）加入结果。

Fork/Join框架的核心是由下列两个类组成的。

①ForkJoinPool：这个类实现了ExecutorService接口和工作窃取算法（Work-Stealing Algorithm）。它管理工作者线程，并提供任务的状态信息，以及任务的执行信息。

②ForkJoinTask：这个类是一个将在ForkJoinPool中执行的任务的基类。

理解一个概念的最好方法是在实践中体会他，我们先写一个小程序，在此基础上一点一点来分析：

public class ForkJoinPoolTest {
    public static void main(String[] args) throws InterruptedException {
        ForkJoinPool pool = new ForkJoinPool();
        pool.submit(new PrintTask(1,100));
        pool.awaitTermination(2, TimeUnit.SECONDS);//阻塞当前线程直到 ForkJoinPool 中所有的任务都执行结束
        pool.shutdown();
    }
}

class PrintTask extends RecursiveAction{
    private int start;
    private int end;
    private int num;
    final int MAX = 50;

    public PrintTask(int start, int end) {
        this.start = start;
        this.end = end;
    }

    @Override
    protected void compute() {
        if(end - start < 50){
            for(int i = start;i <= end; i++){
                num += i;
            }
            System.out.println("当前任务结果为： "+num);
        }else{
            int mid = (end + start)/2;
            PrintTask left = new PrintTask(start,mid);
            PrintTask right = new PrintTask(mid+1,end);
            left.fork();
            right.fork();
        }
    }
}

结果为：

当前任务结果为： 3775
当前任务结果为： 1275

Process finished with exit code 0

我们通过结果可以看到当前任务被分裂为两个子任务去执行。而执行任务的类继承了RecursiveAction这个类，那他到底在Fork-Join框架中发挥什么作用呢？我们不妨看一下：

首先我们来看一下Fork-Join框架提交任务的方法仍旧还是submit和execute：

void execute(ForkJoinTask<?> task) //安排（异步）执行给定任务

void execute(Runnable task) //在未来的某个时候执行给定的命令

<T> ForkJoinTask<T> submit(Callable<T> task) //执行一个有返回值得任务，返回一个Future类型的实例代表任务的结果

<T> ForkJoinTask<T> submit(ForkJoinTask<T> task) //提交一个ForkJoinTask类型的任务

ForkJoinTask<?> submit(Runnable task) //提交一个Runnable类型的任务，返回一个Future类型的实例代表任务结果 

<T> ForkJoinTask<T> submit(Runnable task, T result) //提交一个Runnable类型的任务，返回一个Future类型的实例代表任务结果

由execute和submit的参数我们可以看到Fork-join框架可以提交ForkJoinTask，Callable和Runnable类型的任务。这个ForkJoinTask我们之前没见过，先来看一下：

public abstract class ForkJoinTask<V> implements Future<V>, Serializable {
}

我们看到ForkJoinTask实现了Future接口，一个ForkJoinTask是一个轻量级的Future。对ForkJoinTask效率源于一组限制（这只是部分静态强制执行）反映其用途作为计算任务计算纯函数或纯粹孤立的对象操作。主要的协调机制fork()，安排异步执行，而不进行join()，直到任务的结果已经计算。通常我们并不直接继承 ForkJoinTask，它包含了太多的抽象方法。针对特定的问题，我们可以选择 ForkJoinTask 的不同子类来完成任务：

RecursiveAction：用于任务没有返回结果的场景。

RecursiveTask：用于任务有返回结果的场景。

上面的例子中我们就是继承了RecursiveAction子类用于没有返回结果的场景，下面我们再看一下RecursiveTask用于有返回结果的场景：

public class TestRecursiveTask {

    public static void main(String[] args) {
        Integer result = 0;
        ForkJoinPool pool = new ForkJoinPool();
        Future<Integer> future = pool.submit(new SumTask(30));
        try {
            result = future.get();
        } catch (InterruptedException e) {
            e.printStackTrace();
        } catch (ExecutionException e) {
            e.printStackTrace();
        }
        System.out.println(result+"===========================");
    }
}
class SumTask extends RecursiveTask<Integer> {
    int num;

    public SumTask(int num) {
        this.num = num;
    }

    @Override
    protected Integer compute() {
        if(num <= 20){
            try {
                Thread.sleep(1000);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            System.out.println("生产完成"+num+"个产品");
            return num;
        }else{
            SumTask task1 = new SumTask(20);
            SumTask task2 = new SumTask(num - 20);
            task1.fork();
            task2.fork();
            return task1.join() + task2.join();
        }
    }
}

结果为：

生产完成20个产品
生产完成10个产品
30===========================

Process finished with exit code 0

我们看到继承RecursiveTask类指定了返回值类型为Integer，在compute方法中的返回值类型即为Integer类型。

从以上的例子中可以看到，通过使用 Fork/Join 模式，软件开发人员能够方便地利用多核平台的计算能力。尽管还没有做到对软件开发人员完全透明，Fork/Join 模式已经极大地简化了编写并发程序的琐碎工作。对于符合 Fork/Join 模式的应用，软件开发人员不再需要处理各种并行相关事务，例如同步、通信等，以难以调试而闻名的死锁和 data race 等错误也就不会出现，提升了思考问题的层次。你可以把 Fork/Join 模式看作并行版本的 Divide and Conquer 策略，仅仅关注如何划分任务和组合中间结果，将剩下的事情丢给 Fork/Join 框架。

posted @ 2017-02-20 21:02 rickiyang 阅读(370) 评论(0) 收藏举报

刷新页面返回顶部

rickiyang

java并发编程（十八）----(线程池)java线程池框架Fork-Join

公告