代码改变世界

揭示同步块索引(上):从lock开始

2009-03-13 12:27  横刀天笑  阅读(...)  评论(... 编辑 收藏

大家都知道引用类型对象除实例字段的开销外,还有两个字段的开销:类型指针和同步块索引(SyncBlockIndex)。同步块索引这个东西比起它的兄弟类型指针更少受人关注,显得有点冷落,其实此兄功力非凡,在CLR里可谓叱咤风云,很多功能都要借助它来实现。 接下来我会用三篇来介绍同步块索引在.NET中的所作所为。
既然本章副标题是从lock开始,那我就举几个lock的示例:

代码1

   1: public class Singleton
   2: {
   3:     private static object lockHelper = new object();
   4:     private static Singleton _instance = null;
   5:     public static Singleton Instance
   6:     {
   7:         get
   8:         {
   9:             lock(lockHelper)
  10:             {
  11:                 if(_instance == null)
  12:                     _instance = new Singleton();
  13:             }
  14:             return _instance;
  15:         }
  16:     }
  17: } 

代码2

   1: public class Singleton
   2: {
   3:     private static Singleton _instance = null;
   4:     public static Singleton Instance
   5:     {
   6:         get
   7:         {
   8:             object lockHelper = new object();
   9:             lock(lockHelper)
  10:             {
  11:                 if(_instance==null)
  12:                     _instance = new Singleton();
  13:             }
  14:             return _instance;
  15:         }
  16:     }
  17: } 

代码3

   1: public class Singleton
   2: {
   3:     private static Singleton _instance = null;
   4:     public static Singleton Instance
   5:     {
   6:         get
   7:         {
   8:             lock(typeof(Singleton))
   9:             {
  10:                 if(_instance==null)
  11:                     _instance = new Singleton();
  12:             }
  13:             return_instance;
  14:         }
  15:     }
  16: } 

代码4

   1: public void DoSomething()
   2: {
   3:     lock(this)
   4:     {
   5:         //dosomething
   6:     }
   7: } 

上面四种代码,对于加锁的方式来说(不讨论其他)哪一种是上上选?对于这个问题的答案留在本文最后解答。

让我们先来看看在Win32的时代,我们如何做到CLR中的lock的效果。在Win32时,Windows为我们提供了一个CRITICAL_SECTION结构,看看上面的单件模式,如果使用CRITICAL_SECTION的方式如何实现?

   1: class Singleton
   2: {
   3:     private:
   4:         CRITICAL_SECTIONg_cs;
   5:         static Singleton _instance = NULL;
   6:     public:
   7:         Singleton()
   8:         {
   9:             InitializeCriticalSection(&g_cs);
  10:         }
  11:         static Singleton GetInstance()
  12:         {
  13:             EnterCriticalSection(&g_cs);
  14:             if(_instance!=NULL)
  15:                 _instance=newSingleton();
  16:             LeaveCriticalSection(&g_cs);
  17:             return_instance;
  18:         }
  19:         ~Singleton()
  20:         {
  21:             DeleteCriticalSection(&g_cs);
  22:         }
  23: }

Windows提供四个方法来操作这个CRITICAL_SECTION,在构造函数里我们使用InitializeCriticalSection这个方法初始化这个结构,它知道如何初始化CRITICAL_SECTION结构的成员,当我们要进入一个临界区访问共享资源时,我们使用EnterCriticalSection方法,该方法首先会检查CRITICAL_SECTION的成员,检查是否已经有线程进入了临界区,如果有,则线程会等待,否则会设置CRITICAL_SECTION的成员,标识出本线程进入了临界区。当临界区操作结束后,我们使用LeaveCriticalSection方法标识线程离开临界区。在Singleton类的析构函数里,我们使用DeleteCriticalSection方法销毁这个结构。整个过程就是如此。
我们可以在WinBase.h里找到CRITICAL_SECTION的定义:

typedef RTL_CRITICAL_SECTION CRITICAL_SECTION;

  可以看到,CRITICAL_SECTION实际上就是RTL_CRITICAL_SECTION,而RTL_CRITICAL_SECTION又是在WinNT.h里定义的:

   1: typedef struct _RTL_CRITICAL_SECTION{
   2: PRTL_CRITICAL_SECTION_DEBUGDebugInfo;
   3: //
   4: //Thefollowingthreefieldscontrolenteringandexitingthecritical
   5: //sectionfortheresource
   6: //
   7: LONG LockCount;
   8: LONG RecursionCount;
   9: HANDLE OwningThread;//fromthethread'sClientId->UniqueThread
  10: HANDLE LockSemaphore;
  11: ULONG _PTRSpinCount;//forcesizeon64-bitsystemswhenpacked
  12: }RTL_CRITICAL_SECTION,*PRTL_CRITICAL_SECTION; 

   从上面的定义和注释,聪明的你肯定知道Windows API提供的这几个方法是如何操作CRITICAL_SECTION结构的吧。在这里我们只需要关注OwningThread成员,当有线程进入临界区的时候,这个成员就会指向当前线程的句柄。

说了这么多,也许有人已经厌烦了,不是说好说lock么,怎么说半天Win32 API呢,实际上CLR的lock与Win32 API实现方式几乎是一样的。但CLR并没有提供CRITICAL_SECTION结构,不过CLR提供了同步块,CLR还提供了System.Threading.Monitor类。

实际上使用lock的方式,与下面的代码是等价的:

   1: try{ 
   2:     Monitor.Enter(obj); 
   3:     //… 
   4: }finally{ 
   5:     Monitor.Exit(obj); 
   6: } 

(以下内容只限制在本文,为了简单,有的说法很片面,更详细的内容会在后面两篇里描述)

当CLR初始化的时候,CLR会初始化一个SyncBlock的数组,当一个线程到达Monitor.Enter方法时,该线程会检查该方法接受的参数的同步块索引,默认情况下对象的同步块索引是一个负数(实际上并不是负数,我这里只是为了叙说方便),那么表明该对象并没有一个关联的同步块,CLR就会在全局的SyncBlock数组里找到一个空闲的项,然后将数组的索引赋值给该对象的同步块索引,SyncBlock的内容和CRITICAL_SECTION的内容很相似,当Monitor.Enter执行时,它会设置SyncBlock里的内容,标识出已经有一个线程占用了,当另外一个线程进入时,它就会检查SyncBlock的内容,发现已经有一个线程占用了,该线程就会等待,当Monitor.Exit执行时,占用的线程就会释放SyncBlock,其他的线程可以进入操作了。

好了,有了上面的解释,我们现在可以判断本文前面给出的几个代码,哪一个是上上选呢?

对于代码2,锁定的对象是作为一个局部变量,每个线程进入的时候,锁定的对象都会不一样,它的SyncBlock每一次都是重新分配的,这个根本谈不上什么锁定不锁定。

对于代码3,一般说来应该没有什么事情,但这个操作却是很危险的,typeof(Singleton)得到的是Singleton的Type对象,所有Singleton实例的Type都是同一个,Type对象也是一个对象,它也有自己的SyncBlock,Singleton的Type对象的SyncBlock在程序中只会有一份,为什么说这种做法是危险的呢?如果在该程序中,其他毫不相干的地方我们也使用了lock(typeof(Singleton)),虽然它和这里的锁定毫无关系,但是只要一个地方锁定了,各个地方的线程都会在等待。

对于代码4,实际上代码4的性质和代码3差不多,如果有一个地方使用了DoSomething方法所在类的实例进行lock,而且恰好如this是同一个实例,那么两个地方就会互斥了。

由此看来只有代码1是上上选,之所以是这样,是因为代码1将锁定的对象作为私有字段,只有这个对象内部可以访问,外部无法锁定。 上面只是从文字上叙说,也许你觉得证据不足,我们就搬来代码作证。 使用ILDasm反编译上面单件模式的Instance属性的代码,其中一段IL代码如下所示:

   1: IL_0007:stloc.1
   2: IL_0008:call void [mscorlib]System.Threading.Monitor::Enter(object)
   3: IL_000d:nop
   4: .try
   5: {
   6:     IL_000e:nop
   7:     IL_000f:ldsfld class Singleton Singleton::_instance
   8:     //….
   9:     //…
  10: }
  11: finally
  12: {
  13:     IL_002b:ldloc.1
  14:     IL_002c:call void [mscorlib]System.Threading.Monitor::Exit(object)
  15:     IL_0031:nop
  16:     IL_0032:endfinally
  17: } 

为了简单,我省去了一部分代码。但是很明显,我们看到了System.Threading.Monitor.Enter和Exit。然后我们拿出Reflector看看这个Monitor到底是何方神圣。哎呀,发现Monitor.Enter和Monitor.Exit的代码如下所示:

   1: [MethodImpl(MethodImplOptions.InternalCall)]
   2: public static extern void Enter(objectobj);
   3: [MethodImpl(MethodImplOptions.InternalCall),ReliabilityContract(Consistency.WillNotCorruptState,Cer.Success)]
   4: public static extern void Exit(objectobj); 

只见方法使用了extern关键字,方法上面还标有[MethodImpl(MethodImplOptions.InternalCall)]这样的特性,实际上这说明Enter和Exit的代码是在内部C++的代码实现的。只好拿出Rotor的代码求助了,对于所有"内部实现"的代码,我们可以在sscli20\clr\src\vm\ecall.cpp里找到映射:

   1: FCFuncStart(gMonitorFuncs) 
   2: FCFuncElement("Enter", JIT_MonEnter) 
   3: FCFuncElement("Exit", JIT_MonExit) 
   4:
   5: FCFuncEnd() 

原来Enter映射到JIT_MonEnter,一步步的找过去,我们最终到了这里:

Sscli20\clr\src\vm\jithelpers.cpp:

   1: HCIMPL_MONHELPER(JIT_MonEnterWorker_Portable, Object* obj) 
   2: { 
   3:     //省略大部分代码 
   4:     OBJECTREF objRef = ObjectToOBJECTREF(obj); 
   5:     objRef->EnterObjMonitor(); 
   6: } 
   7: HCIMPLEND 

objRef就是object的引用,EnterObjMonitor方法的代码如下:

   1: void EnterObjMonitor() 
   2: { 
   3:     GetHeader()->EnterObjMonitor(); 
   4: } 

GetHeader()方法获取对象头ObjHeader,在ObjHeader里有对EnterObjMonitor()方法的定义:

   1: void ObjHeader::EnterObjMonitor() 
   2: { 
   3:     GetSyncBlock()->EnterMonitor(); 
   4: } 

GetSyncBlock()方法会获取该对象对应的SyncBlock,在SyncBlock里有EnterMonitor方法的定义:

   1: void EnterMonitor() 
   2: { 
   3:     m_Monitor.Enter(); 
   4: } 

离核心越来越近了,m_Monitor是一个AwareLock类型的字段,看看AwareLock类内Enter方法的定义:

   1: void AwareLock::Enter() 
   2: { 
   3:     Thread* pCurThread = GetThread(); 
   4:     for (;;) 
   5:     { 
   6:          volatile LONG state = m_MonitorHeld; 
   7:         if (state == 0) 
   8:         { 
   9:             // Common case: lock not held, no waiters. Attempt to acquire lock by 
  10:              // switching lock bit. 
  11:             if (FastInterlockCompareExchange((LONG*)&m_MonitorHeld, 1, 0) == 0) 
  12:             { 
  13:                 break; 
  14:             } 
  15:         } 
  16:         else 
  17:         { 
  18:             // It's possible to get here with waiters but no lock held, but in this 
  19:              // case a signal is about to be fired which will wake up a waiter. So 
  20:              // for fairness sake we should wait too. 
  21:              // Check first for recursive lock attempts on the same thread. 
  22:              if (m_HoldingThread == pCurThread) 
  23:              { 
  24:                  goto Recursion; 
  25:              } 
  26:             // Attempt to increment this count of waiters then goto contention 
  27:             // handling code. 
  28:         if (FastInterlockCompareExchange((LONG*)&m_MonitorHeld, (state + 2), state) == state) 
  29:         { 
  30:              goto MustWait;  
  31:         } 
  32:     } 
  33: } 
  34:     // We get here if we successfully acquired the mutex. 
  35:     m_HoldingThread = pCurThread; 
  36:     m_Recursion = 1; 
  37:     pCurThread->IncLockCount(); 
  38:     return; 
  39: MustWait: 
  40:      // Didn't manage to get the mutex, must wait. 
  41:     EnterEpilog(pCurThread); 
  42:      return; 
  43:     Recursion: 
  44:      // Got the mutex via recursive locking on the same thread. 
  45:     m_Recursion++; 
  46: } 

从上面的代码我们可以看到,先使用GetThread()获取当前的线程,然后取出m_MonitorHeld字段,如果现在没有线程进入临界区,则设置该字段的状态,然后将m_HoldingThread设置为当前线程,从这一点上来这与Win32的过程应该是一样的。如果从m_MonitorHeld字段看,有线程已经进入临界区则分两种情况:第一,是否已进入的线程如当前线程是同一个线程,如果是,则把m_Recursion递加,如果不是,则通过EnterEpilog(pCurThread)方法,当前线程进入线程等待队列。

通过上面的文字描述和代码的跟踪,在我们的大脑中应该有这样一张图了:

总结

现在你应该知道lock背后发生的事情了吧。下一次面试的时候,当别人问你同步块索引的时候,你就可以滔滔不绝的和他论述一番。接下来还有两篇分析同步块的其他作用。
欢迎拍砖,祝编程愉快。