13.8 线程池

一、使用线程池管理线程
二、使用ForkJoinPool利用多CPU

系统启动一个新线程的成本是比较高的，因为它涉及到与操作系统交互。在这种情形下，使用线程池可以很好地提高性能，尤其是当程序中需要创建大量生存期很短暂的线程时，更应该考虑使用线程池。
与数据库连接池类似的是，线程池在系统启动时即创建大量空闲的线程，程序将一个Runnable对象传给线程池，线程池就会启动一条线程来执行该对象的run方法，当run方法执行结束后，该线程并不会死亡，而是再次返回线程池中成为空闲状态，等待执行下一个Runnable对象的run方法。
使用线程池可以有效地控制系统中并发线程的数量，当系统中包含大量并发线程时，会导致系统的性能下降，甚至导致JVM崩溃，而线程池的最大线程参数可以控制系统中并发线程数不能超过此数。

一、使用线程池管理线程

1.1 Executor工厂类的方法——创建线程池

JDK1.5提供了一个Executors工厂类来产生线程池，该工厂类里包含如下几个静态工厂方法来创建连接池：
（1）newCachedThreadPool()：创建一个具有缓存功能的线程池，系统根据需要创建线程，这些线程将会被缓存在线程池中。
（2）newFixedThreadPool(int nThreads)：创建一个可重用的、具有固定线程数的线程池。
（3）newSingleThreadExecutor()：创建一个只有单线程的线程池，它相当于newFixedThreadPool方法时传入参数为1。
（4）newScheduledThreadPool(int corePoolSize)：创建具有指定线程数的线程池，它可以在指定延迟后执行线程任务。corePoolSize指池中所保存的线程数，即使线程是空闲的也被保存在线程池内。
（5）newSingleThreadScheduledExecutor()：创建只有一条线程的线程池，它可以在指定延迟后执行线程任务。
（6）ExecutorService newWorkStealingPool(int parallelism):创建持有足够线程的线程池来支持给定的并行级别，该方法会使用多个队列来减少竞争。
（7）ExecutorService newWorkStealingPool():该方法是上一个方法的简化版本。如果当前机器有4个CPU，则目标并行级别被设置为4，也就是相当于为前一个方法传入4作为参数。
上面7个方法中的前3个方法返回一个ExecutorService对象，该对象代表一个线程池，它可以执行Runnable对象或Callable对象所代表的线程；
(4)(5)两个方法返回一个ScheduledExecutorService线程池，它是ExecutorService的子类，它可以在指定延迟后执行线程任务；
(6)(7)两个方法是Java 8新增的，可以充分利用多CPU并行能力。这两个方法生成work stealing池，都相当于后台线程池，如果所有的前台线程都死亡了，work stealing池中的线程会自动死亡。

1.2 ExecutorService对象——执行Runnable或Callable对象

ExecutorService代表尽快执行线程的线程池（只要线程池中有空闲线程立即执行线程任务），程序只要将一个Runnable对象或Callable对象（代表线程任务）提交给该线程池即可，该线程池就会尽快执行该任务。ExecutorService里提供了如下三个方法：
（1）Future<?> submit(Runnable task)：将一个Runnable对象提交给指定的线程池。线程池将在有空闲线程时执行Runnable对象代表的任务。其中Future对象代表Runnable任务的返回值——但run方法没有返回值，所以Future对象将在run方法执行结束后返回null。但可以调用Future的isDone()、isCancelled()方法来获得Runnable对象的执行状态。
（2） Future submit(Runnable task, T result)：将一个Runnable对象提交给指定的线程池。线程池将在有空闲线程时执行Runnable对象代表的任务，result显式指定线程执行结束后的返回值。，所以Future对象将在run方法执行结束后返回result。
（3） Future submit(Callable task)：将一个Callable对象提交给指定的线程池。线程池将在有空闲线程时执行Callable对象代表的任务，Future代表Callable对象里call方法的返回值。

1.3 ScheduledExecutorService对象——在指定延迟，或周期性执行线程任务的线程池

ScheduledExecutorService代表可在指定延迟，或周期性执行线程任务的线程池，它提供了如下四个方法：
(1)ScheduledFuture schedule(Callable callable, long delay, TimeUnit unit)：指定callable任务将在delay延迟后执行。
(2)ScheduledFuture schedule(Runnable command, long delay, TimeUnit unit)：指定command任务将在delay延迟后执行。 (3)ScheduledFuture scheduleAtFixedRate(Runnable command, long initialDelay, long period, TimeUnit unit)：指定command任务将在delay延迟后执行，而且以设定频率重复执行。也就是说，在initialDelay后开始执行，依次在 initialDelay+period 、initialDelay + 2 * period...处重复执行，依此类推。
(4)ScheduledFuture<?> scheduleWithFixedDelay(Runnable command, long initialDelay, long delay, TimeUnit unit)：创建并执行一个在给定初始延迟后首次启用的定期操作，随后，在每一次执行终止和下一次执行开始之间都存在给定的延迟。如果任务的任一次执行时遇到异常，就会取消后续执行。否则，只能通过程序来显式取消或终止来终止该任务。

1.4 线程池的shutdown()和shutdownNow()

用完一个线程池后，应该调用该线程池的shutdown()方法，该方法将启动线程池的关闭序列，调用shutdown()方法后的线程池不再接受新任务，但会将以前所有已提交的任务执行完成。当线程池中的所有任务都执行完成后，池中的所有线程都会死亡；
另外也可以调用线程池的shutdownNow()方法来关闭线程池，该方法试图停止所有正在执行的活动任务，暂停处理正在等待的任务，并返回等待执行的任务列表。

1.5 使用线程池的步骤

（1）调用Executors类的静态工厂方法创建一个ExecutorService对象或ScheduledExecutorService对象，其中前者代表简单的线程池，后者代表能以任务调度方式执行线程的线程池。
（2）创建Runnable实现类或Callable实现类的实例，作为线程执行任务。
（3）调用ExecutorService对象的submit方法来提交Runnable实例或Callable实例；或调用ScheduledExecutorService的schedule来执行线程。
（4）当不想提交任何任务时调用ExecutorService对象的shutdown方法来关闭线程池。
下面程序使用线程池来执行Runnable对象所代表任务：

package section8;

import java.util.concurrent.*;

public class ThreadPoolTest
{
    public static void main(String[] args) throws ExecutionException, InterruptedException {
        //创建一个具有固定线程数（6）的线程池
        ExecutorService pool= Executors.newFixedThreadPool(6);
        //使用Lambda表达式创建Runnable对象
        Runnable target=()->{
            for(var i=0;i<10;i++)
            {
                System.out.println(Thread.currentThread().getName()+" 当前变量i的值为："+i);
            }
        };
        //创建Callable对象
        Callable<Integer> a=()->{
            int count=0;
            for(var i=0;i<10;i++)
            {
                System.out.println(Thread.currentThread().getName()+" 当前变量i的值为"+i);
                count=count+1;
            }
            return count;
        };
        //使用FutureTask对象封装该Callable对象的call()方法的返回值
        FutureTask<Integer> task=new FutureTask<>(a);
        //向线程池提交两个线程
        pool.submit(target);
        pool.submit(task);
        System.out.println("Callable对象的call()方法的返回值："+task.get());
        //关闭线程池
        pool.shutdown();
    }
}
pool-1-thread-2 当前变量i的值为0
pool-1-thread-1 当前变量i的值为：0
pool-1-thread-2 当前变量i的值为1
pool-1-thread-1 当前变量i的值为：1
pool-1-thread-2 当前变量i的值为2
pool-1-thread-1 当前变量i的值为：2
pool-1-thread-2 当前变量i的值为3
pool-1-thread-1 当前变量i的值为：3
pool-1-thread-2 当前变量i的值为4
pool-1-thread-1 当前变量i的值为：4
pool-1-thread-2 当前变量i的值为5
pool-1-thread-1 当前变量i的值为：5
pool-1-thread-2 当前变量i的值为6
pool-1-thread-1 当前变量i的值为：6
pool-1-thread-2 当前变量i的值为7
pool-1-thread-1 当前变量i的值为：7
pool-1-thread-2 当前变量i的值为8
pool-1-thread-1 当前变量i的值为：8
pool-1-thread-2 当前变量i的值为9
pool-1-thread-1 当前变量i的值为：9
Callable对象的call()方法的返回值：10

上面程序创建了Runnable实现类、Callable实现类和Future实现类，这里并没有之间创建线程、启动线程来运行，而是通过线程池来执行该任务。可以看到两个任务交替执行的效果。

二、使用ForkJoinPool利用多CPU

为了充分利用多CPU、多核CPU的性能优势，计算机系统应该可以充分“挖掘”每个CPU的计算能力，绝不能让每个CPU处于空闲状态。为了充分利用多CPU、多核CPU的优势，可以考虑把一个任务拆分成多个“小任务”，把多个小任务放到多个处理器核心并行执行；当多个“小任务”执行完成后，再将这些执行结果合并起来即可。
Java 7提供了ForkJoinPool来支持将一个任务拆分为多个“小任务”并行计算能力，再把多个结果合成总的计算结果。ForkJoinPool是ExecutorService的实现类，因此是一种特殊的线程池。
ForkJoinPool提供如下两个构造器：
（1）ForkJoinPool(int parallelism):创建一个包含parallelism个并行线程的parallelism。
（2）parallelism：以Runtime.Processors()方法的返回值作为parallelism参数来创建ForkLoinPool.
java 8进一步扩展了ForkJoinPool的功能，Java 8为ForkJoinPool增加了通用池的功能。ForkJoinPool类通过如下两个静态方法提供通用池功能：
（1）ForkJoinPool commonPool():该方法返回一个通用池，通用池的运行状态不会受shutdown()或shutdownNow()方法的影响。当然程序可以直接执行System.exit(0);来终止虚拟机，通用池中正在执行的任务都会被自动终止。
（2）int getCommonPoolParallelism():该方法返回通用池的并行级别。
创建了ForkJoinPool实例之后，就可以调用ForkJoinPool的submit(ForkJoinPool task)或invoke(ForkJoinPool task)方法来执行任务。其中ForkJoinTask代表一个可以并行、合并的任务。ForkJoinTask是一个抽象类，它还有两个抽象子类：RecursiveAction和RecursiveTask。其中RecursiveTask代表有返回值的任务，而RecursiveAction代表没有返回值的任务。
下图显式了ForkJoinPool、ForkJoinTask等类的类图。

下面以执行返回值的“大任务”（简单地打印0-300的数值）为例，程序将一个"大任务"拆分成多个小任务，并将任务交给ForkJoinPool来执行。

package section8;

import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.RecursiveAction;
import java.util.concurrent.TimeUnit;

//继承RecursiveAction来实现“可分解”的任务
class PrintTask extends RecursiveAction
{
    //每个小任务最多打印50个数
    private  static final int THRESHOLD=50;
    private int start;
    private int end;
    //打印从start到end之间的数
    public PrintTask(int start,int end)
    {
        this.start=start;
        this.end=end;
    }
    @Override
    protected void compute() {
        //当end和start之间的差小于THRESHOLD时，开始打印
        if(end-start<THRESHOLD)
        {
            for(var i=start;i<end;i++)
            {
                System.out.println(Thread.currentThread().getName()+"的i的值："+i);
            }
        }
        else
        {
            //当end与start之间的差大于THRESHOLD，即打印的数超过50个
            //将大任务分解成两个小任务
            int middle=(start+end)/2;
            var left=new PrintTask(start,middle);
            var right=new PrintTask(middle,end);
            //并行执行两个“小任务”
            left.fork();
            right.fork();
        }

    }
}
public class ForkJoinPoolTest
{
    public static void main(String[] args) throws InterruptedException {
        var pool=new ForkJoinPool();
        //提交可分解的PrintTask任务
        pool.submit(new PrintTask(0,300));
        pool.awaitTermination(2, TimeUnit.SECONDS);
        //关闭线程
        pool.shutdown();
    }
}

上面程序中PrintTask类实现了对执行打印任务的分解，分别后的任务调用fork()方法开始并行运行。运行上面的程序将看到如图所示的结果：

从上图执行结果来看，ForkJoinPool启动了4个线程（1，3，5，7）来执行这个打印任务——这是因为测试计算机的CPU是4核的。不仅如此，程序打印0-300之间的数不是连续的。这是因为程序将任务进行分解，分解后的任务并行运行，所以不会按顺序打印0-299。
上面定义的任务是一个没有返回值的打印任务，如果大任务是有返回值的任务，则可以让任务继承RecursiveTask，其中泛型参数T就代表该任务返回值类型。下面程序示范了RecursiveTask对一个长度为100的数组的元素值进行累加：

package section8;

import java.util.Random;
import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.Future;
import java.util.concurrent.RecursiveTask;

//继承RecursiveTask来实现“可分解”的任务
class CalTask extends RecursiveTask<Integer>
{
    //每个任务最多累加20个数
    private static final int THRESHOLD=20;
    private int arr[];
    private int start;
    private int end;
    //累加从start到end的数组元素
    public CalTask(int[] arr,int start,int end)
    {
        this.arr=arr;
        this.start=start;
        this.end=end;
    }
    @Override
    protected Integer compute() {
        int sum=0;
        //当end与start之间的差小于THRESHOLD时，开始进行累加
        if(end-start<THRESHOLD)
        {
            for(var i=start;i<end;i++)
            {
                sum+=arr[i];
            }
            return sum;
        }
        else
        {
            //当end与start之间的差大于THRESHOLD,即需要累加的数超过20
            //将大任务分解成小任务
            int middle=(start+end)/2;
            var left=new CalTask(arr,start,middle);
            var right=new CalTask(arr,middle,end);
            //并行执行两个程序
            left.fork();
            right.fork();
            //把小任务累加的结果合并起来
            return left.join()+right.join();//①
        }
    }
}
public class Sum
{
    public static void main(String[] args)
        throws Exception
    {
        var arr=new int[100];
        var rand=new Random();
        var total=0;
        //初始化100个数字元素
        for(int i=0;i<100;i++)
        {
            int temp=rand.nextInt(20);
            //对数组元素赋值，并将元素的值添加到sum总和中
            arr[i]=temp;
            total+=temp;
        }
        System.out.println("直接累加计算得到的结果："+total);
        //创建一个通用池
        ForkJoinPool pool=ForkJoinPool.commonPool();
        //提交可分解的CalTask任务
        Future<Integer> future=pool.submit(new CalTask(arr,0,arr.length));
        System.out.println("线程池运行结果："+future.get());
        //关闭线程池
        pool.shutdown();
    }
}
直接累加计算得到的结果：1011
线程池运行结果：1011

与前一个程序基本类似，同样是将任务进行了分解，并调用分解后的任务的fork()方法是它们并行执行。与前一个程序不相同的是，现在的任务是带返回值的，因此程序还在①号代码出将两个任务的返回值进行了合并。

posted @ 2020-05-13 19:12 小新和风间阅读(172) 评论(0) 收藏举报

刷新页面返回顶部

由来君子行最长，予亦知君寄心远