揭示同步块索引（上）：从lock开始

2009-03-13 12:27 横刀天笑阅读(9847) 评论(21) 编辑收藏举报

大家都知道引用类型对象除实例字段的开销外，还有两个字段的开销：类型指针和同步块索引（SyncBlockIndex）。同步块索引这个东西比起它的兄弟类型指针更少受人关注，显得有点冷落，其实此兄功力非凡，在CLR里可谓叱咤风云，很多功能都要借助它来实现。接下来我会用三篇来介绍同步块索引在.NET中的所作所为。
既然本章副标题是从lock开始，那我就举几个lock的示例：

代码1

        1: public class Singleton

       2: {

       3:     private static object lockHelper = new object();

       4:     private static Singleton _instance = null;

       5:     public static Singleton Instance

       6:     {

       7:         get

       8:         {

       9:             lock(lockHelper)

      10:             {

      11:                 if(_instance == null)

      12:                     _instance = new Singleton();

      13:             }

      14:             return _instance;

      15:         }

      16:     }

      17: }

代码2

       1: public class Singleton

       2: {

       3:     private static Singleton _instance = null;

       4:     public static Singleton Instance

       5:     {

       6:         get

       7:         {

       8:             object lockHelper = new object();

       9:             lock(lockHelper)

      10:             {

      11:                 if(_instance==null)

      12:                     _instance = new Singleton();

      13:             }

      14:             return _instance;

      15:         }

      16:     }

      17: }

代码3

       1: public class Singleton

       2: {

       3:     private static Singleton _instance = null;

       4:     public static Singleton Instance

       5:     {

       6:         get

       7:         {

       8:             lock(typeof(Singleton))

       9:             {

      10:                 if(_instance==null)

      11:                     _instance = new Singleton();

      12:             }

      13:             return_instance;

      14:         }

      15:     }

      16: }

代码4

       1: public void DoSomething()

       2: {

       3:     lock(this)

       4:     {

       5:         //dosomething

       6:     }

       7: }

上面四种代码，对于加锁的方式来说（不讨论其他）哪一种是上上选？对于这个问题的答案留在本文最后解答。

让我们先来看看在Win32的时代，我们如何做到CLR中的lock的效果。在Win32时，Windows为我们提供了一个CRITICAL_SECTION结构，看看上面的单件模式，如果使用CRITICAL_SECTION的方式如何实现？

       1: class Singleton

       2: {

       3:     private:

       4:         CRITICAL_SECTIONg_cs;

       5:         static Singleton _instance = NULL;

       6:     public:

       7:         Singleton()

       8:         {

       9:             InitializeCriticalSection(&g_cs);

      10:         }

      11:         static Singleton GetInstance()

      12:         {

      13:             EnterCriticalSection(&g_cs);

      14:             if(_instance!=NULL)

      15:                 _instance=newSingleton();

      16:             LeaveCriticalSection(&g_cs);

      17:             return_instance;

      18:         }

      19:         ~Singleton()

      20:         {

      21:             DeleteCriticalSection(&g_cs);

      22:         }

      23: }

Windows提供四个方法来操作这个CRITICAL_SECTION，在构造函数里我们使用InitializeCriticalSection这个方法初始化这个结构，它知道如何初始化CRITICAL_SECTION结构的成员，当我们要进入一个临界区访问共享资源时，我们使用EnterCriticalSection方法，该方法首先会检查CRITICAL_SECTION的成员，检查是否已经有线程进入了临界区，如果有，则线程会等待，否则会设置CRITICAL_SECTION的成员，标识出本线程进入了临界区。当临界区操作结束后，我们使用LeaveCriticalSection方法标识线程离开临界区。在Singleton类的析构函数里，我们使用DeleteCriticalSection方法销毁这个结构。整个过程就是如此。
我们可以在WinBase.h里找到CRITICAL_SECTION的定义：

typedef RTL_CRITICAL_SECTION CRITICAL_SECTION;

可以看到，CRITICAL_SECTION实际上就是RTL_CRITICAL_SECTION，而RTL_CRITICAL_SECTION又是在WinNT.h里定义的：

       1: typedef struct _RTL_CRITICAL_SECTION{

       2: PRTL_CRITICAL_SECTION_DEBUGDebugInfo;

       3: //

       4: //Thefollowingthreefieldscontrolenteringandexitingthecritical

       5: //sectionfortheresource

       6: //

       7: LONG LockCount;

       8: LONG RecursionCount;

       9: HANDLE OwningThread;//fromthethread'sClientId->UniqueThread

      10: HANDLE LockSemaphore;

      11: ULONG _PTRSpinCount;//forcesizeon64-bitsystemswhenpacked

      12: }RTL_CRITICAL_SECTION,*PRTL_CRITICAL_SECTION;

从上面的定义和注释，聪明的你肯定知道Windows API提供的这几个方法是如何操作CRITICAL_SECTION结构的吧。在这里我们只需要关注OwningThread成员，当有线程进入临界区的时候，这个成员就会指向当前线程的句柄。

说了这么多，也许有人已经厌烦了，不是说好说lock么，怎么说半天Win32 API呢，实际上CLR的lock与Win32 API实现方式几乎是一样的。但CLR并没有提供CRITICAL_SECTION结构，不过CLR提供了同步块，CLR还提供了System.Threading.Monitor类。

实际上使用lock的方式，与下面的代码是等价的：

       1: try{ 

       2:     Monitor.Enter(obj); 

       3:     //… 

       4: }finally{ 

       5:     Monitor.Exit(obj); 

       6: }

（以下内容只限制在本文，为了简单，有的说法很片面，更详细的内容会在后面两篇里描述）

当CLR初始化的时候，CLR会初始化一个SyncBlock的数组，当一个线程到达Monitor.Enter方法时，该线程会检查该方法接受的参数的同步块索引，默认情况下对象的同步块索引是一个负数(实际上并不是负数，我这里只是为了叙说方便)，那么表明该对象并没有一个关联的同步块，CLR就会在全局的SyncBlock数组里找到一个空闲的项，然后将数组的索引赋值给该对象的同步块索引，SyncBlock的内容和CRITICAL_SECTION的内容很相似，当Monitor.Enter执行时，它会设置SyncBlock里的内容，标识出已经有一个线程占用了，当另外一个线程进入时，它就会检查SyncBlock的内容，发现已经有一个线程占用了，该线程就会等待，当Monitor.Exit执行时，占用的线程就会释放SyncBlock，其他的线程可以进入操作了。

好了，有了上面的解释，我们现在可以判断本文前面给出的几个代码，哪一个是上上选呢？

对于代码2，锁定的对象是作为一个局部变量，每个线程进入的时候，锁定的对象都会不一样，它的SyncBlock每一次都是重新分配的，这个根本谈不上什么锁定不锁定。

对于代码3，一般说来应该没有什么事情，但这个操作却是很危险的，typeof(Singleton)得到的是Singleton的Type对象，所有Singleton实例的Type都是同一个，Type对象也是一个对象，它也有自己的SyncBlock，Singleton的Type对象的SyncBlock在程序中只会有一份，为什么说这种做法是危险的呢？如果在该程序中，其他毫不相干的地方我们也使用了lock(typeof(Singleton))，虽然它和这里的锁定毫无关系，但是只要一个地方锁定了，各个地方的线程都会在等待。

对于代码4，实际上代码4的性质和代码3差不多，如果有一个地方使用了DoSomething方法所在类的实例进行lock，而且恰好如this是同一个实例，那么两个地方就会互斥了。

由此看来只有代码1是上上选，之所以是这样，是因为代码1将锁定的对象作为私有字段，只有这个对象内部可以访问，外部无法锁定。上面只是从文字上叙说，也许你觉得证据不足，我们就搬来代码作证。使用ILDasm反编译上面单件模式的Instance属性的代码，其中一段IL代码如下所示：

       1: IL_0007:stloc.1

       2: IL_0008:call void [mscorlib]System.Threading.Monitor::Enter(object)

       3: IL_000d:nop

       4: .try

       5: {

       6:     IL_000e:nop

       7:     IL_000f:ldsfld class Singleton Singleton::_instance

       8:     //….

       9:     //…

      10: }

      11: finally

      12: {

      13:     IL_002b:ldloc.1

      14:     IL_002c:call void [mscorlib]System.Threading.Monitor::Exit(object)

      15:     IL_0031:nop

      16:     IL_0032:endfinally

      17: }

为了简单，我省去了一部分代码。但是很明显，我们看到了System.Threading.Monitor.Enter和Exit。然后我们拿出Reflector看看这个Monitor到底是何方神圣。哎呀，发现Monitor.Enter和Monitor.Exit的代码如下所示：

       1: [MethodImpl(MethodImplOptions.InternalCall)]

       2: public static extern void Enter(objectobj);

       3: [MethodImpl(MethodImplOptions.InternalCall),ReliabilityContract(Consistency.WillNotCorruptState,Cer.Success)]

       4: public static extern void Exit(objectobj);

只见方法使用了extern关键字，方法上面还标有[MethodImpl(MethodImplOptions.InternalCall)]这样的特性，实际上这说明Enter和Exit的代码是在内部C++的代码实现的。只好拿出Rotor的代码求助了，对于所有"内部实现"的代码，我们可以在sscli20\clr\src\vm\ecall.cpp里找到映射：

       1: FCFuncStart(gMonitorFuncs) 

       2: FCFuncElement("Enter", JIT_MonEnter) 

       3: FCFuncElement("Exit", JIT_MonExit) 

       4: … 

       5: FCFuncEnd()

原来Enter映射到JIT_MonEnter，一步步的找过去，我们最终到了这里：

Sscli20\clr\src\vm\jithelpers.cpp：

       1: HCIMPL_MONHELPER(JIT_MonEnterWorker_Portable, Object* obj) 

       2: { 

       3:     //省略大部分代码 

       4:     OBJECTREF objRef = ObjectToOBJECTREF(obj); 

       5:     objRef->EnterObjMonitor(); 

       6: } 

       7: HCIMPLEND

objRef就是object的引用，EnterObjMonitor方法的代码如下：

       1: void EnterObjMonitor() 

       2: { 

       3:     GetHeader()->EnterObjMonitor(); 

       4: }

GetHeader()方法获取对象头ObjHeader，在ObjHeader里有对EnterObjMonitor()方法的定义：

       1: void ObjHeader::EnterObjMonitor() 

       2: { 

       3:     GetSyncBlock()->EnterMonitor(); 

       4: }

GetSyncBlock()方法会获取该对象对应的SyncBlock，在SyncBlock里有EnterMonitor方法的定义：

       1: void EnterMonitor() 

       2: { 

       3:     m_Monitor.Enter(); 

       4: }

离核心越来越近了，m_Monitor是一个AwareLock类型的字段，看看AwareLock类内Enter方法的定义：

       1: void AwareLock::Enter() 

       2: { 

       3:     Thread* pCurThread = GetThread(); 

       4:     for (;;) 

       5:     { 

       6:          volatile LONG state = m_MonitorHeld; 

       7:         if (state == 0) 

       8:         { 

       9:             // Common case: lock not held, no waiters. Attempt to acquire lock by 

             // switching lock bit. 

            if (FastInterlockCompareExchange((LONG*)&m_MonitorHeld, 1, 0) == 0) 

            { 

                break; 

            } 

        } 

        else 

        { 

            // It's possible to get here with waiters but no lock held, but in this 

             // case a signal is about to be fired which will wake up a waiter. So 

             // for fairness sake we should wait too. 

             // Check first for recursive lock attempts on the same thread. 

             if (m_HoldingThread == pCurThread) 

             { 

                 goto Recursion; 

             } 

            // Attempt to increment this count of waiters then goto contention 

            // handling code. 

        if (FastInterlockCompareExchange((LONG*)&m_MonitorHeld, (state + 2), state) == state) 

        { 

             goto MustWait;  

        } 

    } 

} 

    // We get here if we successfully acquired the mutex. 

    m_HoldingThread = pCurThread; 

    m_Recursion = 1; 

    pCurThread->IncLockCount(); 

    return; 

MustWait: 

     // Didn't manage to get the mutex, must wait. 

    EnterEpilog(pCurThread); 

     return; 

    Recursion: 

     // Got the mutex via recursive locking on the same thread. 

    m_Recursion++; 

}

从上面的代码我们可以看到，先使用GetThread()获取当前的线程，然后取出m_MonitorHeld字段，如果现在没有线程进入临界区，则设置该字段的状态，然后将m_HoldingThread设置为当前线程，从这一点上来这与Win32的过程应该是一样的。如果从m_MonitorHeld字段看，有线程已经进入临界区则分两种情况：第一，是否已进入的线程如当前线程是同一个线程，如果是，则把m_Recursion递加，如果不是，则通过EnterEpilog(pCurThread)方法，当前线程进入线程等待队列。

通过上面的文字描述和代码的跟踪，在我们的大脑中应该有这样一张图了：

总结

现在你应该知道lock背后发生的事情了吧。下一次面试的时候，当别人问你同步块索引的时候，你就可以滔滔不绝的和他论述一番。接下来还有两篇分析同步块的其他作用。
欢迎拍砖，祝编程愉快。

会员力量，点亮园子希望

刷新页面返回顶部

横刀天笑的碎碎念

揭示同步块索引（上）：从lock开始

About