[C#]async和await刨根问底

上一篇随笔留下了几个问题没能解决:
· 调用IAsyncStateMachine.MoveNext方法的线程何时发起的?
· lambda的执行为何先于MoveNext方法?
· 后执行的MoveNext方法做了些什么事情?

那么今天就来尝试解决它们吧~
PS: 本文中部分代码来自上一篇随笔,具体来源可参考注释中的章节标题

一、哪里来的线程

通过上一篇随笔的调查我们知道了,async标记的方法的方法体会被编译到一个内部结构体的MoveNext方法中,并且也找到了MoveNext的调用者,再且也证实了有两个调用者是来自于主线程之外的同一个工作线程。
可是这一个线程是何时发起的呢?上一次调查时没能找到答案,这一次就继续从MoveNext方法开始,先找找看Task相关的操作有哪些。

 1 // 三、理解await
 2 bool '<>t__doFinallyBodies';
 3 Exception '<>t__ex';
 4 int CS$0$0000;
 5 TaskAwaiter<string> CS$0$0001;
 6 TaskAwaiter<string> CS$0$0002;
 7 
 8 try
 9 {
10     '<>t__doFinallyBodies' = true;
11     CS$0$0000 = this.'<>1__state';
12     if (CS$0$0000 != 0)
13     {
14         CS$0$0001 = this.'<>4__this'.GetHere().GetAwaiter();
15         if (!CS$0$0001.IsCompleted)
16         {
17             this.'<>1__state' = 0;
18             this.'<>u__$awaiter1' = CS$0$0001;
19             this.'<>t__builder'.AwaitUnsafeOnCompleted(ref CS$0$0001, ref this);
20             '<>t__doFinallyBodies' = false;
21             return;
22         }
23     }
24     else
25     {
26         CS$0$0001 = this.'<>u__$awaiter1';
27         this.'<>u__$awaiter1' = CS$0$0002;
28         this.'<>1__state' = -1;
29     }
30 
31     Console.WriteLine(CS$0$0001.GetResult());
32 }

注意到14行的GetHere方法返回了一个Task<string>,随后的GetAwaiter返回的是TaskAwaiter<string>。
不过这两个Get方法都没有做什么特别的处理,那么就看看接下来是谁使用了TaskAwaiter<string>实例
于是就来看看19行的AsyncVoidMethodBuilder.AwaitUnsafeOnCompleted里面做了些什么吧。

 1 // System.Runtime.CompilerServices.AsyncVoidMethodBuilder
 2 [__DynamicallyInvokable, SecuritySafeCritical]
 3 public void AwaitUnsafeOnCompleted<TAwaiter, TStateMachine>(
 4     ref TAwaiter awaiter, ref TStateMachine stateMachine)
 5     where TAwaiter : ICriticalNotifyCompletion
 6     where TStateMachine : IAsyncStateMachine
 7 {
 8     try
 9     {
10         Action completionAction = this.m_coreState
11             .GetCompletionAction<AsyncVoidMethodBuilder, TStateMachine>(ref this, ref stateMachine);
12         awaiter.UnsafeOnCompleted(completionAction);
13     }
14     catch (Exception exception)
15     {
16         AsyncMethodBuilderCore.ThrowAsync(exception, null);
17     }
18 }

这里主要做了两件事:
一是创建了一个Action,MoveNext方法的信息已经随着stateMachine被封装进去了。
二是把上面这个Action交给Awaiter,让它在await的操作完成后执行这个Action。

先来看看Action的构建细节吧:

 1 // System.Runtime.CompilerServices.AsyncMethodBuilderCore
 2 [SecuritySafeCritical]
 3 internal Action GetCompletionAction<TMethodBuilder, TStateMachine>(ref TMethodBuilder builder, ref TStateMachine stateMachine)
 4     where TMethodBuilder : IAsyncMethodBuilder
 5     where TStateMachine : IAsyncStateMachine
 6 {
 7     Debugger.NotifyOfCrossThreadDependency();
 8     ExecutionContext executionContext = ExecutionContext.FastCapture();
 9     Action action;
10     AsyncMethodBuilderCore.MoveNextRunner moveNextRunner;
11     if (executionContext != null && executionContext.IsPreAllocatedDefault)
12     {
13         action = this.m_defaultContextAction;
14         if (action != null)
15         {
16             return action;
17         }
18         moveNextRunner = new AsyncMethodBuilderCore.MoveNextRunner(executionContext);
19         action = new Action(moveNextRunner.Run);
20         if (AsyncCausalityTracer.LoggingOn)
21         {
22             action = (this.m_defaultContextAction = this.OutputAsyncCausalityEvents<TMethodBuilder>(ref builder, action));
23         }
24         else
25         {
26             this.m_defaultContextAction = action;
27         }
28     }
29     else
30     {
31         moveNextRunner = new AsyncMethodBuilderCore.MoveNextRunner(executionContext);
32         action = new Action(moveNextRunner.Run);
33         if (AsyncCausalityTracer.LoggingOn)
34         {
35             action = this.OutputAsyncCausalityEvents<TMethodBuilder>(ref builder, action);
36         }
37     }
38     if (this.m_stateMachine == null)
39     {
40         builder.PreBoxInitialization<TStateMachine>(ref stateMachine);
41         this.m_stateMachine = stateMachine;
42         this.m_stateMachine.SetStateMachine(this.m_stateMachine);
43     }
44     moveNextRunner.m_stateMachine = this.m_stateMachine;
45     return action;
46 }

这段的分支有点多,行号上的标记是我DEBUG时经过的分支。
可以看到,这个方法里面出现了MoveNext方法的调用者MoveNextRunner,它的Run方法被封装到了返回的Action里。
也就是说,只要这个Action被执行,就会进入Run方法,而Run方法里面有两条分支,简单来说就是:
1.直接调用MoveNext
2.通过InvokeMoveNext调用MoveNext

第40行的赋值不影响Action中的Run,只是在头尾追加了状态记录的操作。
接下来就赶紧找一找执行这个Action的地方吧!
深入UnsafeOnCompleted方法,最终可以找到如下的方法,第一个参数就是要跟踪的对象:

 1 // System.Threading.Tasks.Task
 2 [SecurityCritical]
 3 internal void SetContinuationForAwait(
 4     Action continuationAction,
 5     bool continueOnCapturedContext,
 6     bool flowExecutionContext,
 7     ref StackCrawlMark stackMark)
 8 {
 9     TaskContinuation taskContinuation = null;
10     if (continueOnCapturedContext)
11     {
12         SynchronizationContext currentNoFlow = SynchronizationContext.CurrentNoFlow;
13         if (currentNoFlow != null && currentNoFlow.GetType() != typeof(SynchronizationContext))
14         {
15             taskContinuation = new SynchronizationContextAwaitTaskContinuation(
16                 currentNoFlow, continuationAction, flowExecutionContext, ref stackMark);
17         }
18         else
19         {
20             TaskScheduler internalCurrent = TaskScheduler.InternalCurrent;
21             if (internalCurrent != null && internalCurrent != TaskScheduler.Default)
22             {
23                 taskContinuation = new TaskSchedulerAwaitTaskContinuation(
24                     internalCurrent, continuationAction, flowExecutionContext, ref stackMark);
25             }
26         }
27     }
28     if (taskContinuation == null && flowExecutionContext)
29     {
30         taskContinuation = new AwaitTaskContinuation(continuationAction, true, ref stackMark);
31     }
32     if (taskContinuation != null)
33     {
34         if (!this.AddTaskContinuation(taskContinuation, false))
35         {
36             taskContinuation.Run(this, false);
37             return;
38         }
39     }
40     else if (!this.AddTaskContinuation(continuationAction, false))
41     {
42         AwaitTaskContinuation.UnsafeScheduleAction(continuationAction, this);
43     }
44 }

同样的,行号的标记意味着经过的分支。继续跟进:

 1 // System.Threading.Tasks.AwaitTaskContinuation
 2 [SecurityCritical]
 3 internal static void UnsafeScheduleAction(Action action, Task task)
 4 {
 5     AwaitTaskContinuation awaitTaskContinuation = new AwaitTaskContinuation(action, false);
 6     TplEtwProvider log = TplEtwProvider.Log;
 7     if (log.IsEnabled() && task != null)
 8     {
 9         awaitTaskContinuation.m_continuationId = Task.NewId();
10         log.AwaitTaskContinuationScheduled(
11             (task.ExecutingTaskScheduler ?? TaskScheduler.Default).Id,
12             task.Id,
13             awaitTaskContinuation.m_continuationId);
14     }
15     ThreadPool.UnsafeQueueCustomWorkItem(awaitTaskContinuation, false);
16 }
 1 // System.Threading.ThreadPool
 2 [SecurityCritical]
 3 internal static void UnsafeQueueCustomWorkItem(IThreadPoolWorkItem workItem, bool forceGlobal)
 4 {
 5     ThreadPool.EnsureVMInitialized();
 6     try
 7     {
 8     }
 9     finally
10     {
11         ThreadPoolGlobals.workQueue.Enqueue(workItem, forceGlobal);
12     }
13 }

这里出现了全局线程池,然而没有找到MSDN对ThreadPoolGlobals的解释,这里头的代码又实在太多了。。。暂且模拟一下看看:

1 Console.WriteLine("HERE");
2 var callback = new WaitCallback(state => Println("From ThreadPool"));
3 ThreadPool.QueueUserWorkItem(callback);
4 Console.WriteLine("THERE");

QueueUserWorkItem方法内部调用了ThreadPoolGlobals.workQueue.Enqueue,运行起来效果是这样的:

HERE
THERE
From ThreadPool

再看看线程信息:

Function: CsConsole.Program.Main(), Thread: 0x2E58 主线程
Function: CsConsole.Program.Main(), Thread: 0x2E58 主线程
Function: CsConsole.Program.Main.AnonymousMethod__6(object), Thread: 0x30EC 工作线程

和async的表现简直一模一样是不是~?从调用堆栈也可以看到lambda的执行是源于这个workQueue

到此为止算是搞定第一个问题了。

二、lambda为何先行

先来回忆一下GetHere方法的内容:

// 三、理解await
Task<string> GetHere()
{
    return Task.Run(() =>
    {
        Thread.Sleep(1000);
        return "HERE";
    });
}

要追踪的lambda就是在这里构造的,而调用GetHere的地方也只有一个,就是MoveNext方法的try块。
而MoveNext的调用方也都找出来了:

其中Start方法是在主线程中调用的,可以由SampleMethod追溯到。那么以下的调用信息:

Function: Test.Program.Main(string[]), Thread: 0xE88 主线程
Function: Test.Program.GetHere.AnonymousMethod__3(), Thread: 0x37DC 工作线程
Function: System.Runtime.CompilerServices.AsyncMethodBuilderCore.MoveNextRunner.Run(), Thread: 0x37DC 工作线程
Function: System.Runtime.CompilerServices.AsyncMethodBuilderCore.MoveNextRunner.InvokeMoveNext(object), Thread: 0x37DC 工作线程

这个顺序不是有点奇怪吗?lambda怎么能先于MoveNextRunner的两个方法执行?
其实我在这里犯了一个很明显的思维错误。。。Start调用来自主线程,lambda调用来自子线程,于是直觉性地否定了它们之间的关联。。。
很显然,整个过程其实应该是这样的:
1. 主线程:Start方法调用了MoveNext,MoveNext调用了GetHere
2. 主线程:GetHere方法返回了包含lambda信息的Task
3. 主线程:Task经过变换与包装,最终进入了线程池
4. 子线程:通过Task调用了lambda
5. 子线程:通过Runner调用了MoveNext

子线程中的lambda是来源于主线程第一次调用的MoveNext,和之后的Run啊InvokeMoveNext是没有关系的,所以这个顺序也就不奇怪了。
通过DEBUG几个关键点即可以验证这一顺序。第二个也算搞定了。

三、MoveNext干了什么

第二个问题虽然解决了,但是也让第三个问题显得更加重要,既然lambda确实是先于MoveNext,那么MoveNext到底做了些什么?
通过之前的调查,现在知道了:
1. MoveNext在lambda执行之前被Start方法在主线程调用了一次,过程中把lambda封送给了线程池
2. MoveNext在lambda执行之后被InvokeMoveNext又调用了一次,这一次做了什么处理是尚不明了的

回头看本文的第一段代码,前后两次进入同一段代码,但是做了不同的事情,那么显然就是两次走了不同的分支咯。
由于这段代码本身是DEBUG不进去的,所以只能在其内部调用的方法里断点了。我打了如下几个断点:
· Task<TResult>.GetAwaiter
· AsyncVoidMethodBuilder.AwaitUnsafeOnCompleted
· TaskAwaiter<TResult>.GetResult
· Program.SampleMethod
· MoveNextRunner.InvokeMoveNext

来看看执行结果如何吧:

Function: Test.Program.SampleMethod(), Thread: 0x9BC 主线程
Function: System.Threading.Tasks.Task<TResult>.GetAwaiter(), Thread: 0x9BC 主线程
Function: System.Runtime.CompilerServices.AsyncVoidMethodBuilder.AwaitUnsafeOnCompleted<TAwaiter,TStateMachine>(ref TAwaiter, ref TStateMachine), Thread: 0x9BC 主线程
Function: System.Runtime.CompilerServices.AsyncMethodBuilderCore.MoveNextRunner.InvokeMoveNext(object), Thread: 0x3614 工作线程
Function: System.Runtime.CompilerServices.TaskAwaiter<TResult>.GetResult(), Thread: 0x3614 工作线程

需要注意的是,断到InvokeMoveNext里头的时候,只有这一行代码:

((IAsyncStateMachine)stateMachine).MoveNext();

而当我按下F11步入之后,可以猜一猜跳到了哪:

async void SampleMethod()
{
    Console.WriteLine(await GetHere());
}

而在这个时候GetResult还没执行到。
由此可以整理出try块里的执行过程如下:

 1 try
 2 {
 3     '<>t__doFinallyBodies' = true;
 4     CS$0$0000 = this.'<>1__state';
 5     if (CS$0$0000 != 0)
 6     {
 7         CS$0$0001 = this.'<>4__this'.GetHere().GetAwaiter();
 8         if (!CS$0$0001.IsCompleted)
 9         {
10             this.'<>1__state' = 0;
11             this.'<>u__$awaiter1' = CS$0$0001;
12             this.'<>t__builder'.AwaitUnsafeOnCompleted(ref CS$0$0001, ref this);
13             '<>t__doFinallyBodies' = false;
14             return;
15         }
16     }
17     else
18     {
19         CS$0$0001 = this.'<>u__$awaiter1';
20         this.'<>u__$awaiter1' = CS$0$0002;
21         this.'<>1__state' = -1;
22     }
23 
24     Console.WriteLine(CS$0$0001.GetResult());
25 }

红字是第一次经过的分支,黄底是第二次经过的分支。
而前面说到的F11进入的区块,实际上就是这里的第24行。
所以现在可以知道,第二次MoveNext做了什么:
执行async方法中await后的代码。

四、水落石出

async和await的轮廓逐渐清晰了~再结合上一篇的一段代码来看看:

// 二、理解async
void MoveNext()
{
    bool local0;
    Exception local1;
    
    try
    {
        local0 = true;
        Thread.Sleep(1000);
        Console.WriteLine("HERE");
    }
    catch (Exception e)
    {
        local1 = e;
        this.'<>1__state' = -2;
        this.'<>t__builder'.SetException(local1);
        return;
    }

    this.'<>1__state' = -2;
    this.'<>t__builder'.SetResult()
}

黄底的两句代码原本是在哪的还记得吗?看这里:

// 二、理解async
async void SampleMethod()
{
    Thread.Sleep(1000);
    Console.WriteLine("HERE");
}

因为这个async方法中没有出现await调用,所以可以认为仅有的两句代码是出现在await操作之前。
再让SampleMethod变成这样:

async void SampleMethod()
{
    Console.WriteLine("WHERE");
    Console.WriteLine(await GetHere());
}

再看看现在的MoveNext方法:

 1 try
 2 {
 3     '<>t__doFinallyBodies' = true;
 4     CS$0$0000 = this.'<>1__state';
 5     if (CS$0$0000 != 0)
 6     {
 7         Console.WriteLine("WHERE");
 8         CS$0$0001 = this.'<>4__this'.GetHere().GetAwaiter();
 9         if (!CS$0$0001.IsCompleted)
10         {
11             this.'<>1__state' = 0;
12             this.'<>u__$awaiter1' = CS$0$0001;
13             this.'<>t__builder'.AwaitUnsafeOnCompleted(ref CS$0$0001, ref this);
14             '<>t__doFinallyBodies' = false;
15             return;
16         }
17     }
18     else
19     {
20         CS$0$0001 = this.'<>u__$awaiter1';
21         this.'<>u__$awaiter1' = CS$0$0002;
22         this.'<>1__state' = -1;
23     }
24 
25     Console.WriteLine(CS$0$0001.GetResult());
26 }

这样就可以很明显的看出来await前后的代码被放到了两个区块里,而这两个区块,也就是之前看到的两次执行MoveNext走过的分支。

最终调查结果如下
1. async方法中的代码会被移交给IAsyncStateMachine的MoveNext方法
2. async方法中await操作前后的代码被分离
3. 主线程直接执行await前的代码,并将await的Task移交给线程池ThreadPoolGlobal
4. 子线程执行完主线程递交来的Task后,再次走入MoveNext方法,执行await后的代码


最后想说的是:
这一阵在办公积金销户提取,整个过程就像是个async方法,把申请提交给管理中心(await前操作)以后就得开始等待(await)他们对申请进行审核(执行Task),这个过程加上周末得整整五天,之后还得去管理中心取款(await后操作),总之就是麻烦死了。。。

posted on 2015-06-24 16:36  VD630  阅读(12730)  评论(21编辑  收藏  举报

导航