13.8 线程池


系统启动一个新线程的成本是比较高的,因为它涉及到与操作系统交互。在这种情形下,使用线程池可以很好地提高性能,尤其是当程序中需要创建大量生存期很短暂的线程时,更应该考虑使用线程池。
与数据库连接池类似的是,线程池在系统启动时即创建大量空闲的线程,程序将一个Runnable对象传给线程池,线程池就会启动一条线程来执行该对象的run方法,当run方法执行结束后,该线程并不会死亡,而是再次返回线程池中成为空闲状态,等待执行下一个Runnable对象的run方法。
使用线程池可以有效地控制系统中并发线程的数量,当系统中包含大量并发线程时,会导致系统的性能下降,甚至导致JVM崩溃,而线程池的最大线程参数可以控制系统中并发线程数不能超过此数。

一、使用线程池管理线程

1.1 Executor工厂类的方法——创建线程池

JDK1.5提供了一个Executors工厂类来产生线程池,该工厂类里包含如下几个静态工厂方法来创建连接池:
(1)newCachedThreadPool():创建一个具有缓存功能的线程池,系统根据需要创建线程,这些线程将会被缓存在线程池中。
(2)newFixedThreadPool(int nThreads):创建一个可重用的、具有固定线程数的线程池。
(3)newSingleThreadExecutor():创建一个只有单线程的线程池,它相当于newFixedThreadPool方法时传入参数为1。
(4)newScheduledThreadPool(int corePoolSize):创建具有指定线程数的线程池,它可以在指定延迟后执行线程任务。corePoolSize指池中所保存的线程数,即使线程是空闲的也被保存在线程池内。
(5)newSingleThreadScheduledExecutor():创建只有一条线程的线程池,它可以在指定延迟后执行线程任务。
(6)ExecutorService newWorkStealingPool(int parallelism):创建持有足够线程的线程池来支持给定的并行级别,该方法会使用多个队列来减少竞争。
(7)ExecutorService newWorkStealingPool():该方法是上一个方法的简化版本。如果当前机器有4个CPU,则目标并行级别被设置为4,也就是相当于为前一个方法传入4作为参数。
上面7个方法中的前3个方法返回一个ExecutorService对象,该对象代表一个线程池,它可以执行Runnable对象或Callable对象所代表的线程;
(4)(5)两个方法返回一个ScheduledExecutorService线程池,它是ExecutorService的子类,它可以在指定延迟后执行线程任务;
(6)(7)两个方法是Java 8新增的,可以充分利用多CPU并行能力。这两个方法生成work stealing池,都相当于后台线程池,如果所有的前台线程都死亡了,work stealing池中的线程会自动死亡。

1.2 ExecutorService对象——执行Runnable或Callable对象

ExecutorService代表尽快执行线程的线程池(只要线程池中有空闲线程立即执行线程任务),程序只要将一个Runnable对象或Callable对象(代表线程任务)提交给该线程池即可,该线程池就会尽快执行该任务。ExecutorService里提供了如下三个方法:
(1)Future<?> submit(Runnable task):将一个Runnable对象提交给指定的线程池。线程池将在有空闲线程时执行Runnable对象代表的任务。其中Future对象代表Runnable任务的返回值——但run方法没有返回值,所以Future对象将在run方法执行结束后返回null。但可以调用Future的isDone()、isCancelled()方法来获得Runnable对象的执行状态。
(2) Future submit(Runnable task, T result):将一个Runnable对象提交给指定的线程池。线程池将在有空闲线程时执行Runnable对象代表的任务,result显式指定线程执行结束后的返回值。,所以Future对象将在run方法执行结束后返回result。
(3) Future submit(Callable task):将一个Callable对象提交给指定的线程池。线程池将在有空闲线程时执行Callable对象代表的任务,Future代表Callable对象里call方法的返回值。

1.3 ScheduledExecutorService对象——在指定延迟,或周期性执行线程任务的线程池

ScheduledExecutorService代表可在指定延迟,或周期性执行线程任务的线程池,它提供了如下四个方法:
(1)ScheduledFuture schedule(Callable callable, long delay, TimeUnit unit):指定callable任务将在delay延迟后执行。
(2)ScheduledFuture schedule(Runnable command, long delay, TimeUnit unit):指定command任务将在delay延迟后执行。 (3)ScheduledFuture scheduleAtFixedRate(Runnable command, long initialDelay, long period, TimeUnit unit):指定command任务将在delay延迟后执行,而且以设定频率重复执行。也就是说,在initialDelay后开始执行,依次在 initialDelay+period 、initialDelay + 2 * period...处重复执行,依此类推。
(4)ScheduledFuture<?> scheduleWithFixedDelay(Runnable command, long initialDelay, long delay, TimeUnit unit):创建并执行一个在给定初始延迟后首次启用的定期操作,随后,在每一次执行终止和下一次执行开始之间都存在给定的延迟。如果任务的任一次执行时遇到异常,就会取消后续执行。否则,只能通过程序来显式取消或终止来终止该任务。

1.4 线程池的shutdown()和shutdownNow()

用完一个线程池后,应该调用该线程池的shutdown()方法,该方法将启动线程池的关闭序列,调用shutdown()方法后的线程池不再接受新任务,但会将以前所有已提交的任务执行完成。当线程池中的所有任务都执行完成后,池中的所有线程都会死亡;
另外也可以调用线程池的shutdownNow()方法来关闭线程池,该方法试图停止所有正在执行的活动任务,暂停处理正在等待的任务,并返回等待执行的任务列表。

1.5 使用线程池的步骤

(1)调用Executors类的静态工厂方法创建一个ExecutorService对象或ScheduledExecutorService对象,其中前者代表简单的线程池,后者代表能以任务调度方式执行线程的线程池。
(2)创建Runnable实现类或Callable实现类的实例,作为线程执行任务。
(3)调用ExecutorService对象的submit方法来提交Runnable实例或Callable实例;或调用ScheduledExecutorService的schedule来执行线程。
(4)当不想提交任何任务时调用ExecutorService对象的shutdown方法来关闭线程池。
下面程序使用线程池来执行Runnable对象所代表任务:

package section8;

import java.util.concurrent.*;

public class ThreadPoolTest
{
    public static void main(String[] args) throws ExecutionException, InterruptedException {
        //创建一个具有固定线程数(6)的线程池
        ExecutorService pool= Executors.newFixedThreadPool(6);
        //使用Lambda表达式创建Runnable对象
        Runnable target=()->{
            for(var i=0;i<10;i++)
            {
                System.out.println(Thread.currentThread().getName()+" 当前变量i的值为:"+i);
            }
        };
        //创建Callable对象
        Callable<Integer> a=()->{
            int count=0;
            for(var i=0;i<10;i++)
            {
                System.out.println(Thread.currentThread().getName()+" 当前变量i的值为"+i);
                count=count+1;
            }
            return count;
        };
        //使用FutureTask对象封装该Callable对象的call()方法的返回值
        FutureTask<Integer> task=new FutureTask<>(a);
        //向线程池提交两个线程
        pool.submit(target);
        pool.submit(task);
        System.out.println("Callable对象的call()方法的返回值:"+task.get());
        //关闭线程池
        pool.shutdown();
    }
}
pool-1-thread-2 当前变量i的值为0
pool-1-thread-1 当前变量i的值为:0
pool-1-thread-2 当前变量i的值为1
pool-1-thread-1 当前变量i的值为:1
pool-1-thread-2 当前变量i的值为2
pool-1-thread-1 当前变量i的值为:2
pool-1-thread-2 当前变量i的值为3
pool-1-thread-1 当前变量i的值为:3
pool-1-thread-2 当前变量i的值为4
pool-1-thread-1 当前变量i的值为:4
pool-1-thread-2 当前变量i的值为5
pool-1-thread-1 当前变量i的值为:5
pool-1-thread-2 当前变量i的值为6
pool-1-thread-1 当前变量i的值为:6
pool-1-thread-2 当前变量i的值为7
pool-1-thread-1 当前变量i的值为:7
pool-1-thread-2 当前变量i的值为8
pool-1-thread-1 当前变量i的值为:8
pool-1-thread-2 当前变量i的值为9
pool-1-thread-1 当前变量i的值为:9
Callable对象的call()方法的返回值:10

上面程序创建了Runnable实现类、Callable实现类和Future实现类,这里并没有之间创建线程、启动线程来运行,而是通过线程池来执行该任务。可以看到两个任务交替执行的效果。

二、使用ForkJoinPool利用多CPU

为了充分利用多CPU、多核CPU的性能优势,计算机系统应该可以充分“挖掘”每个CPU的计算能力,绝不能让每个CPU处于空闲状态。为了充分利用多CPU、多核CPU的优势,可以考虑把一个任务拆分成多个“小任务”,把多个小任务放到多个处理器核心并行执行;当多个“小任务”执行完成后,再将这些执行结果合并起来即可。
Java 7提供了ForkJoinPool来支持将一个任务拆分为多个“小任务”并行计算能力,再把多个结果合成总的计算结果。ForkJoinPool是ExecutorService的实现类,因此是一种特殊的线程池。
ForkJoinPool提供如下两个构造器:
(1)ForkJoinPool(int parallelism):创建一个包含parallelism个并行线程的parallelism。
(2)parallelism:以Runtime.Processors()方法的返回值作为parallelism参数来创建ForkLoinPool.
java 8进一步扩展了ForkJoinPool的功能,Java 8为ForkJoinPool增加了通用池的功能。ForkJoinPool类通过如下两个静态方法提供通用池功能:
(1)ForkJoinPool commonPool():该方法返回一个通用池,通用池的运行状态不会受shutdown()或shutdownNow()方法的影响。当然程序可以直接执行System.exit(0);来终止虚拟机,通用池中正在执行的任务都会被自动终止。
(2)int getCommonPoolParallelism():该方法返回通用池的并行级别。
创建了ForkJoinPool实例之后,就可以调用ForkJoinPool的submit(ForkJoinPool task)或invoke(ForkJoinPool task)方法来执行任务。其中ForkJoinTask代表一个可以并行、合并的任务。ForkJoinTask是一个抽象类,它还有两个抽象子类:RecursiveAction和RecursiveTask。其中RecursiveTask代表有返回值的任务,而RecursiveAction代表没有返回值的任务。
下图显式了ForkJoinPool、ForkJoinTask等类的类图。

下面以执行返回值的“大任务”(简单地打印0-300的数值)为例,程序将一个"大任务"拆分成多个小任务,并将任务交给ForkJoinPool来执行。

package section8;

import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.RecursiveAction;
import java.util.concurrent.TimeUnit;

//继承RecursiveAction来实现“可分解”的任务
class PrintTask extends RecursiveAction
{
    //每个小任务最多打印50个数
    private  static final int THRESHOLD=50;
    private int start;
    private int end;
    //打印从start到end之间的数
    public PrintTask(int start,int end)
    {
        this.start=start;
        this.end=end;
    }
    @Override
    protected void compute() {
        //当end和start之间的差小于THRESHOLD时,开始打印
        if(end-start<THRESHOLD)
        {
            for(var i=start;i<end;i++)
            {
                System.out.println(Thread.currentThread().getName()+"的i的值:"+i);
            }
        }
        else
        {
            //当end与start之间的差大于THRESHOLD,即打印的数超过50个
            //将大任务分解成两个小任务
            int middle=(start+end)/2;
            var left=new PrintTask(start,middle);
            var right=new PrintTask(middle,end);
            //并行执行两个“小任务”
            left.fork();
            right.fork();
        }

    }
}
public class ForkJoinPoolTest
{
    public static void main(String[] args) throws InterruptedException {
        var pool=new ForkJoinPool();
        //提交可分解的PrintTask任务
        pool.submit(new PrintTask(0,300));
        pool.awaitTermination(2, TimeUnit.SECONDS);
        //关闭线程
        pool.shutdown();
    }
}

上面程序中PrintTask类实现了对执行打印任务的分解,分别后的任务调用fork()方法开始并行运行。运行上面的程序将看到如图所示的结果:

从上图执行结果来看,ForkJoinPool启动了4个线程(1,3,5,7)来执行这个打印任务——这是因为测试计算机的CPU是4核的。不仅如此,程序打印0-300之间的数不是连续的。这是因为程序将任务进行分解,分解后的任务并行运行,所以不会按顺序打印0-299。
上面定义的任务是一个没有返回值的打印任务,如果大任务是有返回值的任务,则可以让任务继承RecursiveTask,其中泛型参数T就代表该任务返回值类型。下面程序示范了RecursiveTask对一个长度为100的数组的元素值进行累加:

package section8;

import java.util.Random;
import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.Future;
import java.util.concurrent.RecursiveTask;

//继承RecursiveTask来实现“可分解”的任务
class CalTask extends RecursiveTask<Integer>
{
    //每个任务最多累加20个数
    private static final int THRESHOLD=20;
    private int arr[];
    private int start;
    private int end;
    //累加从start到end的数组元素
    public CalTask(int[] arr,int start,int end)
    {
        this.arr=arr;
        this.start=start;
        this.end=end;
    }
    @Override
    protected Integer compute() {
        int sum=0;
        //当end与start之间的差小于THRESHOLD时,开始进行累加
        if(end-start<THRESHOLD)
        {
            for(var i=start;i<end;i++)
            {
                sum+=arr[i];
            }
            return sum;
        }
        else
        {
            //当end与start之间的差大于THRESHOLD,即需要累加的数超过20
            //将大任务分解成小任务
            int middle=(start+end)/2;
            var left=new CalTask(arr,start,middle);
            var right=new CalTask(arr,middle,end);
            //并行执行两个程序
            left.fork();
            right.fork();
            //把小任务累加的结果合并起来
            return left.join()+right.join();//①
        }
    }
}
public class Sum
{
    public static void main(String[] args)
        throws Exception
    {
        var arr=new int[100];
        var rand=new Random();
        var total=0;
        //初始化100个数字元素
        for(int i=0;i<100;i++)
        {
            int temp=rand.nextInt(20);
            //对数组元素赋值,并将元素的值添加到sum总和中
            arr[i]=temp;
            total+=temp;
        }
        System.out.println("直接累加计算得到的结果:"+total);
        //创建一个通用池
        ForkJoinPool pool=ForkJoinPool.commonPool();
        //提交可分解的CalTask任务
        Future<Integer> future=pool.submit(new CalTask(arr,0,arr.length));
        System.out.println("线程池运行结果:"+future.get());
        //关闭线程池
        pool.shutdown();
    }
}
直接累加计算得到的结果:1011
线程池运行结果:1011

与前一个程序基本类似,同样是将任务进行了分解,并调用分解后的任务的fork()方法是它们并行执行。与前一个程序不相同的是,现在的任务是带返回值的,因此程序还在①号代码出将两个任务的返回值进行了合并。

posted @ 2020-05-13 19:12  小新和风间  阅读(140)  评论(0编辑  收藏  举报