代码改变世界

【读书笔记】.Net并行编程高级教程(二)-- 任务并行

2015-10-29 08:13  stoneniqiu  阅读(2326)  评论(2编辑  收藏  举报

      前面一篇提到例子都是数据并行,但这并不是并行化的唯一形式,在.Net4之前,必须要创建多个线程或者线程池来利用多核技术。现在只需要使用新的Task实例就可以通过更简单的代码解决命令式任务并行问题。

1.Task及它的生命周期

      一个Task表示一个异步操作,它的创建和执行都是独立的,因此可以对相关操作的执行拥有完全的控制权;当有很多异步操作作为Task实例加载的时候,为了充分利用运行时的逻辑内核,任务调度器会尝试并行的运行这些任务,当然任务都是有额外的开销,虽然要小于添加线程的开销;

      对Task实例的生命周期的理解非常重要。一个Task的执行,取决于底层硬件和运行时可用的资源。因此Task实例的状态会不断的发生改变,而一个Task实例只会完成其生命周期一次,当Task到达它三种可能的最终状态只后,它就回不去之前的任何状态了。

      

      Task实例有三种可能的初始状态,Created是Task构造函数创建实例的初始状态,WaitForActivation是子任务依赖其他任务完成后等待调度的初始状态,WaitingToRun是通过TaskFactory.StartNew所创建任务的初始状态。表示正在等待调度器挑选自己并运行。

      任务开始执行,状态就变为TaskStatus.Runing。如果还有子任务,主任务的状态会转变到TaskStatus.WaitingForChildrenToComplete状态。并最终到达,Canceled,Faulted和RunToCompletion 三种状态。从字面理解就是任务取消,出错和完成。

2.任务并行。

     前面我们通过Parallel.Invoke来并行加载方法。

  Parallel.Invoke(GenerateAESKeys,GenerateMD5Has);

     通过Task实例也能完成同样的工作。

      var t1 = new Task(GenerateAESKeys);
      var t2 = new Task(GenerateMD5Has);
      t1.Start();
      t2.Start();
      Task.WaitAll(t1, t2);

 Start方法对委托进行初始化。 WaitAll方法会等待两个任务的执行完成之后再往下走。

可以看见,执行过程中,任务的状态不断的发生变化。可以给WaitFor方法加上毫秒数。看任务是否会在指定时间内完成。

  if(!Task.WaitAll(new[]{t1,t2},3000))
            {
                Console.WriteLine("任务执行超过3秒");
                Console.WriteLine(t1.Status.ToString());
                Console.WriteLine(t2.Status.ToString());
 }

即使到达了指定时间,任务还是继续执行。

同样任务本身也是可以等待

  if (t1.Wait(3000))
   {
    Console.WriteLine("任务t1执行超过3秒");
    Console.WriteLine(t1.Status.ToString());
    }

3.通过取消标记取消任务。

    可以通过CancellationToken 来中断任务的执行。这需要再委托中添加一些代码,创建可以取消的任务。

  private static void GenerateMD5HasCancel(CancellationToken ct)
        {
            ct.ThrowIfCancellationRequested();
            var sw = Stopwatch.StartNew();
            for (int i = 0; i < NUM_AES_KEYS; i++)
            {
                var md5M = MD5.Create();
                byte[] data = Encoding.Unicode.GetBytes(Environment.UserName + i);
                byte[] result = md5M.ComputeHash(data);
                string hexString = ConverToHexString(result);
                ct.ThrowIfCancellationRequested();
            }
            Console.WriteLine("MD5:" + sw.Elapsed.ToString());
        }
            Console.WriteLine("任务开始...");
            var cts = new CancellationTokenSource();
            var ct = cts.Token;
            var sw = Stopwatch.StartNew();
            var t1 = Task.Factory.StartNew(() => GenerateMD5HasCancel(ct), ct);
            var t2 = Task.Factory.StartNew(() => GenerateAESKeysCancel(ct), ct);
            
            //1秒后取消任务
            Thread.Sleep(1000);

            cts.Cancel();

            try
            {
                if (!Task.WaitAll(new[] { t1,t2}, 1000))
                {
                    Console.WriteLine("任务执行超过1秒");
                    Console.WriteLine(t1.Status.ToString());
                }
            }
            catch (AggregateException ex)
            {
                foreach (var exc in ex.InnerExceptions)
                {
                    Console.WriteLine(exc.ToString());
                }
                if (t1.IsCanceled)
                {
                    Console.WriteLine("任务1取消了...");
                }
                Console.WriteLine(sw.Elapsed.ToString());
                Console.WriteLine("结束");
            }
CancellationTokenSource能够初始化取消的请求,而CancellationToken能将这些请求传递给异步操作;上面的方法通过Task类的Factory方法得到一个TaskFactory实例,相比Task直接创建任务,这个实例可以使用更多的功能。而StartNew 等价于用Task构造函数创建一个Task并调用Start方法执行。

直接在Debug下面运行,程序会在异常的地方中断。直接运行exe得到上面的结果。 

ThrowIfCancellationRequested在每一次循环迭代都会执行,内部是判断任务取消后抛出一个OperationCanceledException的异常,来避免运行不必要的循环和其他命令。

  public void ThrowIfCancellationRequested()
        {
            if (IsCancellationRequested) 
                ThrowOperationCanceledException();
        }
 private void ThrowOperationCanceledException()
        {
            throw new OperationCanceledException(Environment.GetResourceString("OperationCanceled"), this);
        }

如果有代码正在等待取消,还会自动抛出一个TaskCanceledException异常。会包含在AggregateException中。

4.处理异常。

  修改上面的方法抛出一个异常。

 private static void GenerateMD5HasCancel(CancellationToken ct)
        {
            ct.ThrowIfCancellationRequested();
             //....if (sw.Elapsed.TotalSeconds > 0.5)
                {
                    throw new TimeoutException("超时异常0.5秒");
                }
                ct.ThrowIfCancellationRequested();
            }
            Console.WriteLine("MD5:" + sw.Elapsed.ToString());
        }

修改Main方法的Catch。

                if (t1.IsFaulted)
                {
                    foreach (var exc in ex.InnerExceptions)
                    {
                        Console.WriteLine(exc.ToString());
                    }
                    Console.WriteLine(t1.Status.ToString());
                }

执行结果:

当出现异常时,任务的状态就会转换为Faulted。并不会影响另外一个任务的执行。

5.从任务返回值。

前面的方法都是没有返回值,得到任务的返回值需要使用Task<TResult>实例,TResult要替换为返回的类型。修改AES方法。返回一个指定前缀的List<String>

GenerateMD5HasList:
 private static List<string> GenerateMD5HasList(CancellationToken ct, char prefix)
        {
            ct.ThrowIfCancellationRequested();
            var sw = Stopwatch.StartNew();
            var list = new List<string>();
            for (int i = 0; i < NUM_AES_KEYS; i++)
            {
                var md5M = MD5.Create();
                byte[] data = Encoding.Unicode.GetBytes(Environment.UserName + i);
                byte[] result = md5M.ComputeHash(data);
                string hexString = ConverToHexString(result);
                if (hexString[0] == prefix)
                {
                    list.Add(hexString);
                }
                ct.ThrowIfCancellationRequested();
            }
            Console.WriteLine("MD5:" + sw.Elapsed);
            return list;
        }
View Code
  Console.WriteLine("任务开始...");
            var cts = new CancellationTokenSource();
            var ct = cts.Token;
            
            var t1 = Task.Factory.StartNew(() => GenerateMD5HasList(ct,'A'), ct);
            //等待执行完成
            t1.Wait();

            var res = t1.Result;
            for (int i = 0; i < res.Count; i++)
            {
                Console.WriteLine(res[i]);
            }

而这时的StartNew创建的类型是Task<List<String>>.StartNew源码如下:

  public Task<TResult> StartNew<TResult>(Func<TResult> function)
        {
            StackCrawlMark stackMark = StackCrawlMark.LookForMyCaller;
            Task currTask = Task.InternalCurrent;
            return Task<TResult>.StartNew(currTask, function, m_defaultCancellationToken,
                m_defaultCreationOptions, InternalTaskOptions.None, GetDefaultScheduler(currTask), ref stackMark);
        }

我们还可以将任务串联起来。比如上面的代码。避免写太多代码来检查前面一个任务是否完成。而ContinueWith这个方法可以用来串联多个任务。

            var t1 = Task.Factory.StartNew(() => GenerateMD5HasList(ct,'A'), ct);
            var t2 = t1.ContinueWith((t) =>
            {
                for (int i = 0; i < t.Result.Count; i++)
                {
                    Console.WriteLine(t.Result[i]);
                                    }
            });
            //可以等待t2执行完成
            t2.Wait();

如果需要设置继续的条件,就要用到TaskContinuationOptions,它是一个枚举类型,用来控制另一个任务执行和调度的可选行为

 var t2 = t1.ContinueWith((t) => OtherMethod(t), TaskContinuationOptions.NotOnCanceled);

 NotOnCanceled,就是表示上个任务不取消的情况下执行。例如还有NotOnFaulted.如果上一个任务抛出了异常,那么就不会执行。这里就不一一例举了。

 

 小结:这一章主要是将了基于任务的编程模型,学习了任务的创建、状态,以及如何取消、捕获异常和获得返回值,并能串行任务,任务的延续不仅能简化代码,而且还能帮助调度器对很快就要执行的任务采取正确的操作。下一章学习并发集合。

 

阅读书籍:《C#并行编程高级教程 链接: 下载链: http://pan.baidu.com/s/1bn1BdBx  密码: fn2d

 C#并行编程高级教程

喜欢看书,也喜欢分享书籍(不限技术书籍)的朋友,诚邀加入书山有路群q:452450927 。

第三期书山有路,大家正在读《女人的起源》。 链接: http://pan.baidu.com/s/1ntEhMHz 密码: 84d8

 在喜欢你的人那里,去热爱生活;在不喜欢你的人那里,去看清世界。