张子阳 TraceFact

Dedicated to Asp.Net, C#, XML, DataBase, Design Pattern and Algorithms ...

  博客园 :: 首页 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::
  33 随笔 :: 0 文章 :: 753 评论 :: 38 Trackbacks

C# 类型基础

引言

本文之初的目的是讲述设计模式中的 Prototype(原型)模式,但是如果想较清楚地弄明白这个模式,需要了解对象克隆(Object Clone),Clone其实也就是对象复制。复制又分为了浅度复制(Shallow Copy)和深度复制(Deep Copy),浅度复制 和 深度复制又是以 如何复制引用类型成员来划分的。由此又引出了 引用类型和 值类型,以及相关的对象判等、装箱、拆箱等基础知识。

于是我干脆新起一篇,从最基础的类型开始自底向上写起了。我仅仅想将对于这个主题的理解表述出来,一是总结和复习,二是交流经验,或许有地方我理解的有偏差,希望指正。如果前面基础的内容对你来说过于简单,可以跳跃阅读。

值类型 和 引用类型

我们先简单回顾一下C#中的类型系统。C# 中的类型一共分为两类,一类是值类型(Value Type),一类是引用类型(Reference Type)。值类型 和 引用类型是以它们在计算机内存中是如何被分配的来划分的。值类型包括 结构和枚举,引用类型包括类、接口、委托 等。还有一种特殊的值类型,称为简单类型(Simple Type),比如 byte,int等,这些简单类型实际上是FCL类库类型的别名,比如声明一个int类型,实际上是声明一个System.Int32结构类型。因此,在Int32类型中定义的操作,都可以应用在int类型上,比如 “123.Equals(2)”。

所有的 值类型 都隐式地继承自 System.ValueType类型(注意System.ValueType本身是一个类类型),System.ValueType和所有的引用类型都继承自 System.Object基类。你不能显示地让结构继承一个类,因为C#不支持多重继承,而结构已经隐式继承自ValueType。

NOTE:堆栈(stack)是一种后进先出的数据结构,在内存中,变量会被分配在堆栈上来进行操作。堆(heap)是用于为类型实例(对象)分配空间的内存区域,在堆上创建一个对象,会将对象的地址传给堆栈上的变量(反过来叫变量指向此对象,或者变量引用此对象)。

1.值类型

当声明一个值类型的变量(Variable)的时候,变量本身包含了值类型的全部字段,该变量会被分配在线程堆栈(Thread Stack)上。

假如我们有这样一个值类型,它代表了直线上的一点:

public struct ValPoint {
    public int x;

    public ValPoint(int x) {
       this.x = x;
    }
}

当我们在程序中写下这样的一条变量的声明语句时:

ValPoint vPoint1;

实际产生的效果是声明了vPoint1变量,变量本身包含了值类型的所有字段(即你想要的所有数据)。

NOTE:如果观察MSIL代码,会发现此时变量还没有被压到栈上,因为.maxstack(最高栈数) 为0。并且没有看到入栈的指令,这说明只有对变量进行操作,才会进行入栈。

因为变量已经包含了值类型的所有字段,所以,此时你已经可以对它进行操作了(对变量进行操作,实际上是一系列的入栈、出栈操作)。

vPoint1.x = 10;
Console.WriteLine(vPoint.x); // 输出 10

NOTE:如果vPoint1是一个引用类型(比如class),在运行时会抛出NullReferenceException异常。因为vPoint是一个值类型,不存在引用,所以永远也不会抛出NullReferenceException。

如果你不对vPoint.x进行赋值,直接写Console.WriteLine(vPoint.x),则会出现编译错误:使用了未赋值的局部变量。产生这个错误是因为.Net的一个约束:所有的元素使用前都必须初始化。比如这样的语句也会引发这个错误:

int i;
Console.WriteLine(i);

解决这个问题我们可以通过这样一种方式:编译器隐式地会为结构类型创建了无参数构造函数。在这个构造函数中会对结构成员进行初始化,所有的值类型成员被赋予0或相当于0的值(针对Char类型),所有的引用类型被赋予null值。(因此,Struct类型不可以自行声明无参数的构造函数)。所以,我们可以通过隐式声明的构造函数去创建一个ValPoint类型变量:

ValPoint vPoint1 = new ValPoint();
Console.WriteLine(vPoint.x); // 输出为0

我们将上面代码第一句的表达式由“=”分隔拆成两部分来看:

  • 左边 ValPoint vPoint1,在堆栈上创建一个ValPoint类型的变量vPoint,结构的所有成员均未赋值。在进行new ValPoint()之前,将vPoint压到栈上。
  • 右边new ValPoint(),new 操作符不会分配内存,它仅仅调用ValPoint结构的默认构造函数,根据构造函数去初始化vPoint结构的所有字段。

注意上面这句,new 操作符不会分配内存,仅仅调用ValPoint结构的默认构造函数去初始化vPoint的所有字段。那如果我这样做,又如何解释呢?

Console.WriteLine((new ValPoint()).x);     // 正常,输出为0

在这种情况下,会创建一个临时变量,然后使用结构的默认构造函数对此临时变量进行初始化。我知道我这样很没有说服力,所以我们来看下MS IL代码,为了节省篇幅,我只节选了部分:

.locals init ([0] valuetype Prototype.ValPoint CS$0$0000) // 声明临时变量
IL_0000:  nop
IL_0001:  ldloca.s   CS$0$0000       // 将临时变量压栈
IL_0003:  initobj    Prototype.ValPoint     // 初始化此变量

而对于 ValPoint vPoint = new ValPoint(); 这种情况,其 MSIL代码是:

.locals init ([0] valuetype Prototype.ValPoint vPoint)       // 声明vPoint
IL_0000:  nop
IL_0001:  ldloca.s   vPoint          // 将vPoint压栈
IL_0003:  initobj    Prototype.ValPoint     // 使用initobj初始化此变量

那么当我们使用自定义的构造函数时,ValPoint vPoint = new ValPoint(10),又会怎么样呢?通过下面的代码我们可以看出,实际上会使用call指令(instruction)调用我们自定义的构造函数,并传递10到参数列表中。

.locals init ([0] valuetype Prototype.ValPoint vPoint)
IL_0000:  nop
IL_0001:  ldloca.s   vPoint      // 将 vPoint 压栈
IL_0003:  ldc.i4.s   10          // 将 10 压栈
// 调用构造函数,传递参数
IL_0005:  call       instance void Prototype.ValPoint::.ctor(int32)  

对于上面的MSIL代码不清楚不要紧,有的时候知道结果就已经够用了。关于MSIL代码,有空了我会为大家翻译一些好的文章。

2.引用类型

当声明一个引用类型变量的时候,该引用类型的变量会被分配到堆栈上,这个变量将用于保存位于堆上的该引用类型的实例的内存地址,变量本身不包含对象的数据。此时,如果仅仅声明这样一个变量,由于在堆上还没有创建类型的实例,因此,变量值为null,意思是不指向任何类型实例(堆上的对象)。对于变量的类型声明,用于限制此变量可以保存的类型。

如果我们有一个这样的类,它依然代表直线上的一点:

public class RefPoint {
    public int x;

    public RefPoint(int x) {
       this.x = x;
    }
    public RefPoint() {}
}

当我们仅仅写下一条声明语句:

RefPoint rPoint1;

它的效果就向下图一样,仅仅在堆栈上创建一个不包含任何数据,也不指向任何对象(不包含创建再堆上的对象的地址)的变量。

而当我们使用new操作符时:

rPoint1= new RefPoint(1);

会发生这样的事:

  1. 在应用程序堆(Heap)上创建一个引用类型(Type)的实例(Instance)或者叫对象(Object),并为它分配内存地址。
  2. 自动传递该实例的引用给构造函数。(正因为如此,你才可以在构造函数中使用this来访问这个实例。)
  3. 调用该类型的构造函数。
  4. 返回该实例的引用(内存地址),赋值给rPoint变量。

3.关于简单类型

很多文章和书籍中在讲述这类问题的时候,总是喜欢用一个int类型作为值类型 和一个Object类型 作为引用类型来作说明。本文中将采用自定义的一个 结构 和 类 分别作值类型和引用类型的说明。这是因为简单类型(比如int)有一些CLR实现了的行为,这些行为会让我们对一些操作产生误解。

举个例子,如果我们想比较两个int类型是否相等,我们会通常这样:

int i = 3;
int j = 3;
if(i==j) Console.WriteLine("i equals to j");

但是,对于自定义的值类型,比如结构,就不能用 “==”来判断它们是否相等,而需要在变量上使用Equals()方法来完成。

再举个例子,大家知道string是一个引用类型,而我们比较它们是否相等,通常会这样做:

string a = "123456"; string b = "123456";
if(a == b) Console.WriteLine("a Equals to b");

实际上,在后面我们就会看到,当使用“==”对引用类型变量进行比较的时候,比较的是它们是否指向的堆上同一个对象。而上面a、b指向的显然是不同的对象,只是对象包含的值相同,所以可见,对于string类型,CLR对它们的比较实际上比较的是值,而不是引用。

为了避免上面这些引起的混淆,在对象判等部分将采用自定义的结构和类来分别说明。

装箱 和 拆箱

这部分内容可深可浅,本文只简要地作一个回顾。简单来说,装箱 就是 将一个值类型转换成等值的引用类型。它的过程分为这样几步:

  1. 在堆上为新生成的对象(该对象包含数据,对象本身没有名称)分配内存。
  2. 将 堆栈上 值类型变量的值拷贝到 堆上的对象 中。
  3. 将堆上创建的对象的地址返回给引用类型变量(从程序员角度看,这个变量的名称就好像堆上对象的名称一样)。

当我们运行这样的代码时:

int i = 1;
Object boxed = i;
Console.WriteLine("Boxed Point: " + boxed);

效果图是这样的:

MSIL代码是这样的:

.method private hidebysig static void  Main(string[] args) cil managed
{
  .entrypoint
  // 代码大小       19 (0x13)
  .maxstack  1                   // 最高栈数是1,装箱操作后i会出栈
  .locals init ([0] int32 i,     // 声明变量 i(第1个变量,索引为0)
           [1] object boxed)          // 声明变量 boxed (第2个变量,索引为1)
  IL_0000:  nop
  IL_0001:  ldc.i4.s   10         //#1 将10压栈
  IL_0003:  stloc.0                  //#2 10出栈,将值赋给 i
  IL_0004:  ldloc.0                  //#3 将i压栈
  IL_0005:  box   [mscorlib]System.Int32   //#4 i出栈,对i装箱(复制值到堆,返回地址)
  IL_000a:  stloc.1           //#5 将返回值赋给变量 boxed
  IL_000b:  ldloc.1           // 将 boxed 压栈
// 调用WriteLine()方法
  IL_000c:  call       void [mscorlib]System.Console::WriteLine(object)
  IL_0011:  nop
  IL_0012:  ret
} // end of method Program::Main

而拆箱则是将一个 已装箱的引用类型 转换为值类型:

int i = 1;
Object boxed = i;
int j;
j = (int)boxed;          // 显示声明 拆箱后的类型
Console.WriteLine("UnBoxed Point: " + j);

需要注意的是:UnBox 操作需要显示声明拆箱后转换的类型。它分为两步来完成:

  1. 获取已装箱的对象的地址。
  2. 将值从堆上的对象中拷贝到堆栈上的值变量中。

对象判等

因为我们要提到对象克隆(复制),那么,我们应该有办法知道复制前后的两个对象是否相等。所以,在进行下面的章节前,我们有必要先了解如何进行对象判等。

NOTE:有机会较深入地研究这部分内容,需要感谢 微软的开源 以及 VS2008 的FCL调试功能。关于如何调试 FCL 代码,请参考 Configuring Visual Studio to Debug .NET Framework Source Code

我们先定义用作范例的两个类型,它们代表直线上的一点,唯一区别是一个是引用类型class,一个是值类型struct:

public class RefPoint {      // 定义一个引用类型
    public int x;
    public RefPoint(int x) {
       this.x = x;
    }
}

public struct ValPoint { // 定义一个值类型
    public int x;
    public ValPoint(int x) {
       this.x = x;
    }
}

1.引用类型判等

我们先进行引用类型对象的判等,我们知道在System.Object基类型中,定义了实例方法Equals(object obj),静态方法 Equals(object objA, object objB),静态方法 ReferenceEquals(object objA, object objB) 来进行对象的判等。

我们先看看这三个方法,注意我在代码中用 #number 标识的地方,后文中我会直接引用:

public static bool ReferenceEquals (Object objA, Object objB)
{
     return objA == objB;     // #1
}
 
public virtual bool Equals(Object obj)
{
    return InternalEquals(this, obj);    // #2
}

public static bool Equals(Object objA, Object objB) {
     if (objA==objB) {        // #3
         return true;
     }

     if (objA==null || objB==null) {
         return false;
     }

     return objA.Equals(objB); // #4
}

我们先看ReferenceEquals(object objA, object objB)方法,它实际上简单地返回 objA == objB,所以,在后文中,除非必要,我们统一使用 objA == objB(省去了 ReferenceEquals 方法)。另外,为了范例简单,我们不考虑对象为null的情况。

我们来看第一段代码:

// 复制对象引用
bool result;
RefPoint rPoint1 = new RefPoint(1);
RefPoint rPoint2 = rPoint1;

result = (rPoint1 == rPoint2);      // 返回 true;
Console.WriteLine(result);

result = rPoint1.Equals(rPoint2);   // #2 返回true;
Console.WriteLine(result);

在阅读本文中,应该时刻在脑子里构思一个堆栈,一个堆,并思考着每条语句会在这两种结构上产生怎么样的效果。在这段代码中,产生的效果是:在堆上创建了一个新的RefPoint类型的实例(对象),并将它的x字段初始化为1;在堆栈上创建变量rPoint1,rPoint1保存堆上这个对象的地址;将rPoint1 赋值给 rPoint2时,此时并没有在堆上创建一个新的对象,而是将之前创建的对象的地址复制到了rPoint2。此时,rPoint1和rPoint2指向了堆上同一个对象。

从 ReferenceEquals()这个方法名就可以看出,它判断两个引用变量是不是指向了同一个变量,如果是,那么就返回true。这种相等叫做 引用相等(rPoint1 == rPoint2 等效于 ReferenceEquals)。因为它们指向的是同一个对象,所以对rPoint1的操作将会影响rPoint2:

注意System.Object静态的Equals(Object objA, Object objB)方法,在 #3 处,如果两个变量引用相等,那么将直接返回true。所以,可以预见我们上面的代码rPoint1.Equals(rPoint2); 在 #3 就会返回true。但是我们没有调用静态Equals(),直接调用了实体方法,最后调用了#2 的 InternalEquals(),返回true。(InternalEquals()无资料可查,仅通过调试测得)。

我们再看引用类型的第二种情况:

//创建新引用类型的对象,其成员的值相等
RefPoint rPoint1 = new RefPoint(1);
RefPoint rPoint2 = new RefPoint(1);

result = (rPoint1 == rPoint2);
Console.WriteLine(result);      // 返回 false;

result = rPoint1.Equals(rPoint2);
Console.WriteLine(result);      // #2 返回false

上面的代码在堆上创建了两个类型实例,并用同样的值初始化它们;然后将它们的地址分别赋值给堆上的变量 rPoint1和rPoint2。此时 #2 返回了false,可以看到,对于引用类型,即使类型的实例(对象)包含的值相等,如果变量指向的是不同的对象,那么也不相等。

2.简单值类型判等

注意本节的标题:简单值类型判等,这个简单是如何定义的呢?如果值类型的成员仅包含值类型,那么我们暂且管它叫 简单值类型,如果值类型的成员包含引用类型,我们管它叫复杂值类型。(注意,这只是本文中为了说明我个人作的定义。)

应该还记得我们之前提过,值类型都会隐式地继承自 System.ValueType类型,而ValueType类型覆盖了基类System.Object类型的Equals()方法,在值类型上调用Equals()方法,会调用ValueType的Equals()。所以,我们看看这个方法是什么样的,依然用 #number 标识后面会引用的地方。

public override bool Equals (Object obj) {
   if (null==obj) {
       return false;
   }
   RuntimeType thisType = (RuntimeType)this.GetType();
   RuntimeType thatType = (RuntimeType)obj.GetType();

   if (thatType!=thisType) { // 如果两个对象不是一个类型,直接返回false
       return false;  
   }

   Object thisObj = (Object)this;
   Object thisResult, thatResult;
 
   if (CanCompareBits(this))                // #5
       return FastEqualsCheck(thisObj, obj);    // #6

    // 利用反射获取值类型所有字段
   FieldInfo[] thisFields = thisType.GetFields(BindingFlags.Instance | BindingFlags.Public | BindingFlags.NonPublic);
    // 遍历字段,进行字段对字段比较
   for (int i=0; i<thisFields.Length; i++) {
       thisResult = ((RtFieldInfo)thisFields[i]).InternalGetValue(thisObj,false);
       thatResult = ((RtFieldInfo)thisFields[i]).InternalGetValue(obj, false);

       if (thisResult == null) {
           if (thatResult != null)
               return false;
       }
       else
       if (!thisResult.Equals(thatResult)) {  // #7
           return false;
       }
   }

   return true;
}

我们先来看看第一段代码:

// 复制结构变量
ValPoint vPoint1 = new ValPoint(1);
ValPoint vPoint2 = vPoint1;

result = (vPoint1 == vPoint2);  //编译错误:不能在ValPoint上应用 "==" 操作符
Console.WriteLine(result);  

result = Object.ReferenceEquals(vPoint1, vPoint2); // 隐式装箱,指向了堆上的不同对象
Console.WriteLine(result);          // 返回false

我们先在堆栈上创建了一个变量vPoint1,变量本身已经包含了所有字段和数据。然后在堆栈上复制了vPoint1的一份拷贝给了vPoint2,从常理思维上来讲,我们认为它应该是相等的。接下来我们就试着去比较它们,可以看到,我们不能用“==”直接去判断,这样会返回一个编译错误。如果我们调用System.Object基类的静态方法ReferenceEquals(),有意思的事情发生了:它返回了false。为什么呢?我们看下ReferenceEquals()方法的签名就可以了,它接受的是Object类型,也就是引用类型,而当我们传递vPoint1和vPoint2这两个值类型的时候,会进行一个隐式的装箱,效果相当于下面的语句:

Object boxPoint1 = vPoint1;
Object boxPoint2 = vPoint2;
result = (boxPoint1 == boxPoint2);      // 返回false
Console.WriteLine(result);             

而装箱的过程,我们在前面已经讲述过,上面的操作等于是在堆上创建了两个对象,对象包含的内容相同(地址不同),然后将对象地址分别返回给堆栈上的 boxPoint1和boxPoint2,再去比较boxPoint1和boxPoint2是否指向同一个对象,显然不是,所以返回false。

我们继续,添加下面这段代码:

result = vPoint1.Equals(vPoint2);       // #5 返回true; #6 返回true;
Console.WriteLine(result);      // 输出true

因为它们均继承自ValueType类型,所以此时会调用ValueType上的Equals()方法,在方法体内部,#5 CanCompareBits(this) 返回了true,CanCompareBits(this)这个方法,按微软的注释,意识是说:如果对象的成员中存在对于堆上的引用,那么返回false,如果不存在,返回true。按照ValPoint的定义,它仅包含一个int类型的字段x,自然不存在对堆上其他对象的引用,所以返回了true。从#5 的名字CanCompareBits,可以看出是判断是否可以进行按位比较,那么返回了true以后,#6 自然是进行按位比较了。

接下来,我们对vPoint2做点改动,看看会发生什么:

vPoint2.x = 2;
result = vPoint1.Equals(vPoint2);       // #5 返回true; #6 返回false;
Console.WriteLine(result);

3. 复杂值类型判等

到现在,上面的这些方法,我们还没有走到的位置,就是CanCompareBits返回false以后的部分了。前面我们已经推测出了CanCompareBits返回false的条件(值类型的成员包含引用类型),现在只要实现下就可以了。我们定义一个新的结构Line,它代表直线上的线段,我们让它的一个成员为值类型ValPoint,一个成员为引用类型RefPoint,然后去作比较。

/* 结构类型 ValLine 的定义,
public struct ValLine {
   public RefPoint rPoint;       // 引用类型成员
   public ValPoint vPoint;       // 值类型成员
   public Line(RefPoint rPoint, ValPoint vPoint) {
      this.rPoint = rPoint;
      this.vPoint = vPoint;
   }
}
*/

RefPoint rPoint = new RefPoint(1);
ValPoint vPoint = new ValPoint(1);

ValLine line1 = new ValLine (rPoint, vPoint);
ValLine line2 = line1;

result = line1.Equals(line2);   // 此时已经存在一个装箱操作,调用ValueType.Equals()
Console.WriteLine(result);      // 返回True

这个例子的过程要复杂得多。在开始前,我们先思考一下,当我们写下 line1.Equals(line2)时,已经进行了一个装箱的操作。如果要进一步判等,显然不能去判断变量是否引用的堆上同一个对象,这样的话就没有意义了,因为总是会返回false(装箱后堆上创建了两个对象)。那么应该如何判断呢?对 堆上对象 的成员(字段)进行一对一的比较,而成员又分为两种类型,一种是值类型,一种是引用类型。对于引用类型,去判断是否引用相等;对于值类型,如果是简单值类型,那么如同前一节讲述的去判断;如果是复杂类型,那么当然是递归调用了;最终直到要么是引用类型要么是简单值类型。

NOTE:进行字段对字段的一对一比较,需要用到反射,如果不了解反射,可以参看 .Net 中的反射 系列文章。

好了,我们现在看看实际的过程,是不是如同我们料想的那样,为了避免频繁的拖动滚动条查看ValueType的Equals()方法,我拷贝了部分下来:

public override bool Equals (Object obj) {
 
   if (CanCompareBits(this))                // #5
       return FastEqualsCheck(thisObj, obj);    // #6
    // 利用反射获取类型的所有字段(或者叫类型成员)
   FieldInfo[] thisFields = thisType.GetFields(BindingFlags.Instance | BindingFlags.Public | BindingFlags.NonPublic);
    // 遍历字段进行比较
   for (int i=0; i<thisFields.Length; i++) {
       thisResult = ((RtFieldInfo)thisFields[i]).InternalGetValue(thisObj,false);
       thatResult = ((RtFieldInfo)thisFields[i]).InternalGetValue(obj, false);

       if (thisResult == null) {
           if (thatResult != null)
               return false;
       }
       else
       if (!thisResult.Equals(thatResult)) {  #7
           return false;
       }
   }

   return true;
}

  1. 进入 ValueType 上的 Equals() 方法,#5 处返回了 false;
  2. 进入 for 循环,遍历字段。
  3. 第一个字段是RefPoint引用类型,#7 处,调用 System.Object 的Equals()方法,到达#2,返回true。
  4. 第二个字段是ValPoint值类型,#7 处,调用 System.ValType的Equals()方法,也就是当前方法本身。此处递归调用。
  5. 再次进入 ValueType 的 Equals() 方法,因为 ValPoint 为简单值类型,所以 #5 CanCompareBits 返回了true,接着 #6 FastEqualsCheck 返回了 true。
  6. 里层 Equals()方法返回 true。
  7. 退出 for 循环。
  8. 外层 Equals() 方法返回 true。

对象复制

有的时候,创建一个对象可能会非常耗时,比如对象需要从远程数据库中获取数据来填充,又或者创建对象需要读取硬盘文件。此时,如果已经有了一个对象,再创建新对象时,可能会采用复制现有对象的方法,而不是重新建一个新的对象。本节就讨论如何进行对象的复制。

1.浅度复制

浅度复制 和 深度复制 是以如何复制对象的成员(member)来划分的。一个对象的成员有可能是值类型,有可能是引用类型。当我们对对象进行一个浅度复制的时候,对于值类型成员,会复制其本身(值类型变量本身包含了所有数据,复制时进行按位拷贝);对于引用类型成员(注意它会引用另一个对象),仅仅复制引用,而不创建其引用的对象。结果就是:新对象的引用成员和 复制对象的引用成员 指向了同一个对象。

继续我们上面的例子,如果我们想要进行复制的对象(RefLine)是这样定义的,(为了避免look up,我在这里把代码再贴过来):

// 将要进行 浅度复制 的对象,注意为 引用类型
public class RefLine {
    public RefPoint rPoint;
    public ValPoint vPoint;
    public Line(RefPoint rPoint,ValPoint vPoint){
       this.rPoint = rPoint;
       this.vPoint = vPoint;
    }
}
// 定义一个引用类型成员
public class RefPoint {
    public int x;
    public RefPoint(int x) {
       this.x = x;
    }
}
// 定义一个值类型成员
public struct ValPoint {
    public int x;
    public ValPoint(int x) {
       this.x = x;
    }
}

我们先创建一个想要复制的对象:

RefPoint rPoint = new RefPoint(1);
ValPoint vPoint = new ValPoint(1);
RefLine line = new RefLine(rPoint, vPoint);

它所产生的实际效果是(堆栈上仅考虑line部分):

那么当我们对它复制时,就会像这样(newLine是指向新拷贝的对象的指针,在代码中体现为一个引用类型的变量):

按照这个定义,再回忆上面我们讲到的内容,可以推出这样一个结论:当复制一个结构类型成员的时候,直接创建一个新的结构类型变量,然后对它赋值,就相当于进行了一个浅度复制,也可以认为结构类型隐式地实现了浅度复制。如果我们将上面的RefLine定义为一个结构(Struct),结构类型叫ValLine,而不是一个类,那么对它进行浅度复制就可以这样:

ValLine newLine = line;

实际的效果图是这样:

现在你已经已经搞清楚了什么是浅度复制,知道了如何对结构浅度复制。那么如何对一个引用类型实现浅度复制呢?在.Net Framework中,有一个ICloneable接口,我们可以实现这个接口来进行浅度复制(也可以是深度复制,这里有争议,国外一些人认为ICloneable应该被标识为过时(Obsolete)的,并且提供IShallowCloneable和IDeepCloneble来替代)。这个接口只要求实现一个方法Clone(),它返回当前对象的副本。我们并不需要自己实现这个方法(当然完全可以),在System.Object基类中,有一个保护的MemeberwiseClone()方法,它便用于进行浅度复制。所以,对于引用类型,如果想要实现浅度复制时,只需要调用这个方法就可以了:

public object Clone() {
    return MemberwiseClone();
}

现在我们来做一个测试:

class Program {
    static void Main(string[] args) {

       RefPoint rPoint = new RefPoint(1);
       ValPoint vPoint = new ValPoint(1);
       RefLine line = new RefLine(rPoint, vPoint);

       RefLine newLine = (RefLine)line.Clone();
       Console.WriteLine("Original: line.rPoint.x = {0}, line.vPoint.x = {1}", line.rPoint.x, line.vPoint.x);
       Console.WriteLine("Cloned: newLine.rPoint.x = {0}, newLine.vPoint.x = {1}", newLine.rPoint.x, newLine.vPoint.x);

       line.rPoint.x = 10;      // 修改原先的line的 引用类型成员 rPoint
       line.vPoint.x = 10;      // 修改原先的line的 值类型  成员 vPoint
       Console.WriteLine("Original: line.rPoint.x = {0}, line.vPoint.x = {1}", line.rPoint.x, line.vPoint.x);
       Console.WriteLine("Cloned: newLine.rPoint.x = {0}, newLine.vPoint.x = {1}", newLine.rPoint.x, newLine.vPoint.x);

    }
}

输出为:

Original: line.rPoint.x = 1, line.vPoint.x = 1
Cloned: newLine.rPoint.x = 1, newLine.vPoint.x = 1
Original: line.rPoint.x = 10, line.vPoint.x = 10
Cloned: newLine.rPoint.x = 10, newLine.vPoint.x = 1

可见,复制后的对象和原先对象成了连体婴,它们的引用成员字段依然引用堆上的同一个对象。

2.深度复制

其实到现在你可能已经想到什么时深度复制了,深度复制就是将引用成员指向的对象也进行复制。实际的过程是创建新的引用成员指向的对象,然后复制对象包含的数据。

深度复制可能会变得非常复杂,因为引用成员指向的对象可能包含另一个引用类型成员,最简单的例子就是一个线性链表。

如果一个对象的成员包含了对于线性链表结构的一个引用,浅度复制 只复制了对头结点的引用,深度复制 则会复制链表本身,并复制每个结点上的数据。

考虑我们之前的例子,如果我们期望进行一个深度复制,我们的Clone()方法应该如何实现呢?

public object Clone(){       // 深度复制
    RefPoint rPoint = new RefPoint();       // 对于引用类型,创建新对象
    rPoint.x = this.rPoint.x;           // 复制当前引用类型成员的值 到 新对象
    ValPoint vPoint = this.vPoint;          // 值类型,直接赋值
    RefLine newLine = new RefLine(rPoint, vPoint);
    return newLine;
}

可以看到,如果每个对象都要这样去进行深度复制的话就太麻烦了,我们可以利用串行化/反串行化来对对象进行深度复制:先把对象串行化(Serialize)到内存中,然后再进行反串行化,通过这种方式来进行对象的深度复制:

public object Clone() {
    BinaryFormatter bf = new BinaryFormatter();
    MemoryStream ms = new MemoryStream();
    bf.Serialize(ms, this);
    ms.Position = 0;

    return (bf.Deserialize(ms)); ;
}

我们来做一个测试:

class Program {
    static void Main(string[] args) {
       RefPoint rPoint = new RefPoint(1);
       ValPoint vPoint = new ValPoint(2);

       RefLine line = new RefLine(rPoint, vPoint);
       RefLine newLine = (RefLine)line.Clone();
                 
       Console.WriteLine("Original line.rPoint.x = {0}", line.rPoint.x);
       Console.WriteLine("Cloned newLine.rPoint.x = {0}", newLine.rPoint.x);

       line.rPoint.x = 10;   // 改变原对象 引用成员 的值
       Console.WriteLine("Original line.rPoint.x = {0}", line.rPoint.x);
       Console.WriteLine("Cloned newLine.rPoint.x = {0}", newLine.rPoint.x);
    }
}
输出为:
Original line.rPoint.x = 1
Cloned newLine.rPoint.x = 1
Original line.rPoint.x = 10
Cloned newLine.rPoint.x = 1

可见,两个对象的引用成员已经分离,改变原对象的引用对象的值,并不影响复制后的对象。

这里需要注意:如果想将对象进行序列化,那么对象本身,及其所有的自定义成员(类、结构),都必须使用Serializable特性进行标记。所以,如果想让上面的代码运行,我们之前定义的类都需要进行这样的标记:

[Serializable()]
public class RefPoint { /*略*/}

NOTE:关于特性(Attribute),可以参考 .Net 中的反射(反射特性) 一文。

总结

本文简单地对C#中的类型作了一个回顾。

我们首先讨论了C#中的两种类型--值类型和引用类型,随后简要回顾了装箱/拆箱 操作。接着,详细讨论了C#中的对象判等。最后,我们讨论了浅度复制和 深度复制,并比较了它们之间不同。

希望这篇文章能给你带来帮助!

posted on 2008-01-31 08:34 张子阳. 阅读(3198) 评论(50)  编辑 收藏 所属分类: C# Programming

评论

不错,过了年我研读一下,谢谢。
  回复  引用  查看    

#2楼  2008-01-31 08:42 周银辉      
好文章啊,谢谢,只有年后来看了哦,太长啦
  回复  引用  查看    

#3楼  2008-01-31 09:18 李华星      
LZ辛苦了
  回复  引用  查看    

#4楼  2008-01-31 09:19 阿牛 - 专注OOP      
有深度,强.
  回复  引用  查看    

#5楼  2008-01-31 09:25 Anytao      
秉承张兄一贯的写作特点,娓娓道来而不感枯燥,对类型系统的探索应该引起足够的关照,再次补充一下相关的链接:
http://www.cnblogs.com/anytao/archive/2007/05/11/must_net_07.html
http://www.cnblogs.com/anytao/archive/2007/05/23/must_net_08.html
http://www.cnblogs.com/anytao/archive/2007/05/28/must_net_09.html
http://www.cnblogs.com/anytao/archive/2007/06/18/must_net_10.html
http://www.cnblogs.com/anytao/archive/2007/12/03/must_net_18.html
http://www.cnblogs.com/anytao/archive/2007/12/07/must_net_19.html

呼应一下,有很多问题本来我还想有个继续的论述:-)
  回复  引用  查看    

#6楼 [楼主] 2008-01-31 09:30 张子阳.      
@Anytao

呵呵,你的几篇文章我都有拷回去看的~~ 写得比较深入~~

  回复  引用  查看    

#7楼  2008-01-31 09:33 Anytao      
@张子阳.
哈哈,互相学习,其实关于类型系统部分,我一直觉得是基础修炼的必经之路,你的这篇分析很有角度。虽然比较长,但是读着不累:-)
继续持续的关注:-)
  回复  引用  查看    

#8楼  2008-01-31 09:42 留恋星空      
学习
  回复  引用  查看    

#9楼  2008-01-31 09:50 jaycee [未注册用户]
好文
  回复  引用  查看    

#10楼  2008-01-31 09:52 一路走好      
好文章,雖然有些地方看不懂,但我會慢慢看。
  回复  引用  查看    

#11楼  2008-01-31 09:55 1-2-3      
新照片比以前的那个帅。
  回复  引用  查看    

#12楼  2008-01-31 09:56 DavidWCF [未注册用户]
堆栈应该是后进先出吧?文章很好,很有深度~
  回复  引用  查看    

#13楼 [楼主] 2008-01-31 09:57 张子阳.      
@1-2-3

谢谢~~ 你的也很帅~~
  回复  引用  查看    

#14楼 [楼主] 2008-01-31 09:57 张子阳.      
@DavidWCF

可能笔误了,我改之~~
  回复  引用  查看    

#15楼  2008-01-31 10:44 Seattle      
深刻
  回复  引用  查看    

#16楼  2008-01-31 11:51 VelvetMark      
不错 好文章
收藏了
  回复  引用  查看    

期待你的 Asp.Net 三层式Web应用程序开发 系列
  回复  引用  查看    

#18楼  2008-01-31 12:22 飘渺鍀︶ㄣ风      
好文,收藏了
  回复  引用  查看    

#19楼 [楼主] 2008-01-31 12:41 张子阳.      
@borladn.et

.Net 反射 - Part.2 修改完了以后,就开始那个系列,那个系列完成以前不打算写新文章了。发个part.1然后没了下文这种事以后要杜绝 :-)

  回复  引用  查看    

#20楼  2008-01-31 14:22 jelink      
string a = "123456"; string b = "123456";
if(a == b) Console.WriteLine("a Equals to b");

实际上,在后面我们就会看到,当使用“==”对引用类型变量进行比较的时候,比较的是它们是否指向的堆上同一个对象。而上面a、b指向的显然是不同的对象,只是对象包含的值相同,所以可见,对于string类型,CLR对它们的比较实际上比较的是值,而不是引用。

我对博主的说法不认同,实际在上.NET中a和b的引用是相同的,因为.net的string有一个internal pool的概念在里面,并且string的"=="也是重载的,这里拿string来举例也不妥当。
  回复  引用  查看    

#21楼  2008-01-31 14:57 Anytao      
@jelink
不完全同意。了解String的判等,必须深入了解字符串的驻留机制,也就是那个internal pool的概念,不过string对==的重载实现的是对“值”的比较,Equals方法内部通过EqualHelper方法对字符串进行值比较,所以CLR对a和b的比较是值。例如:

public static void Main()
{
string strA = "123456";
string strB = "123456";
string strC = "123";
string strD = strC + "456";

Console.WriteLine(strA == strB); //True
Console.WriteLine(ReferenceEquals(strA, strB)); //True
Console.WriteLine(strA == strD); //True
Console.WriteLine(ReferenceEquals(strA, strD)); //False
}

当然,了解判等还是避不开对字符串驻留机制的了解。。。
  回复  引用  查看    

#22楼 [楼主] 2008-01-31 15:04 张子阳.      
@jelink

可能这部分我了解的不够深入,但是 EqualsHelper() 方法,我查看了源码,对字符串的判等是比较它们包含的值:



  回复  引用  查看    

#23楼  2008-01-31 15:11 prong [未注册用户]
如下是MSDN的解释:
=================================================
String s1 = "MyTest";
String s2 = new StringBuilder().Append("My").Append("Test").ToString();
String s3 = String.Intern(s2);
Console.WriteLine((Object)s2==(Object)s1); // Different references.
Console.WriteLine((Object)s3==(Object)s1); // The same reference.
公共语言运行库通过维护一个表来存放字符串,该表称为拘留池,它包含程序中以编程方式声明或创建的每个唯一的字符串的一个引用。因此,具有特定值的字符串的实例在系统中只有一个。

例如,如果将同一字符串分配给几个变量,运行库就会从拘留池中检索对该字符串的相同引用,并将它分配给各个变量。

Intern 方法使用拘留池来搜索与 str 值相等的字符串。如果存在这样的字符串,则返回拘留池中它的引用。如果不存在,则向拘留池添加对 str 的引用,然后返回该引用。

在下面的 C# 示例中,值为“MyTest”的字符串 s1 已经留用,因为它在程序中是一个字符串常量。

System.Text.StringBuilder 类生成与 s1 同值的新字符串对象。对该字符串的引用被分配给 s2。

Intern 方法搜索与 s2 具有相同值的字符串。由于存在这样的字符串,该方法会返回分配给 s1 的同一引用,然后将该引用分配给 s3。

引用 s1 和 s2 的比较结果是不相等的,这是因为它们引用的是不同的对象;而引用 s1 和 s3 的比较结果是相等的,因为它们引用的是相同的字符串。

  回复  引用  查看    

#24楼  2008-01-31 15:14 Anytao      
@张子阳.
Artech,对字符串驻留有过讨论,我在新书《你必须知道的.NET》中也有相应的分析,了解string的特殊性,字符串驻留和字符串恒定是很重要的内容:-)
  回复  引用  查看    

#25楼  2008-01-31 15:19 Anytao      
@prong
MSDN的解释不错,就是太死板,技术问题的分析还是可以生动点的;-)
  回复  引用  查看    

#26楼  2008-01-31 15:39 prong [未注册用户]
MSDN中的
System.Text.StringBuilder 类生成与 s1 同值的新字符串对象。对该字符串的引用被分配给 s2。

解释的比较暧昧,为什么生成与 s1 同值的新字符串对象s2,而不是相同的字符串对象?就是因为s2不是字符串常量?
  回复  引用  查看    

#27楼 [楼主] 2008-01-31 15:53 张子阳.      
@Anytao

呵呵,有交流就有进步,以后有问题会找你,都还年轻着呢,慢慢学哈~~ ^O^

  回复  引用  查看    

#28楼  2008-01-31 15:53 Anytao      
@prong
其实这个问题的解释,本质上还是字符串驻留机制,所以想要探求究竟还是有必要将字符串驻留机制了解清楚才行。

正如:
string strA = "123456";
string strB = "123456";
string strC = "123";
string strD = strC + "456";

strA和strD也是值相同,而引用不同一样,本质上仍然是字符串驻留机制。简单的解释是这样的:字符串驻留机制的核心是CLR内部维护了一个哈希表,对于新创建的字符串会添加到该哈希表中,后面创建的字符串会检索哈希表中的元素,如果找到有相同的字符串则会将之前的字符串引用添加给后创建的字符串变量。这也就是为什么ReferenceEquals(strA, strB)结果为true的原因;而对于动态创建的字符串,例如strD,CLR是不会将其加入哈希表维护的,所以ReferenceEquals(strA, strD)的结果为false。但是String类型提供了Intern方法来将动态创建的字符串添加到哈希表,并返回引用,这就是上述结果的解释。

理解了以上机制,也就基本建立了对字符串驻留的理解,当然详细的过程会更加的复杂。

:-)


  回复  引用  查看    

#29楼  2008-01-31 15:55 Anytao      
@张子阳.
呵呵,看你的文章是一种享受,技术是需要分享的,这是我在博客园感觉最大的收获,期待更多的交流。
  回复  引用  查看    

#30楼  2008-01-31 15:55 Anytao      
做个广告,string类型的特殊性,在《你必须知道的.NET》一书中会有详细而生动的分析,敬请期待:-)
  回复  引用  查看    

#31楼  2008-01-31 16:38 prong [未注册用户]
--引用--------------------------------------------------
Anytao: @prong
其实这个问题的解释,本质上还是字符串驻留机制,所以想要探求究竟还是有必要将字符串驻留机制了解清楚才行。

正如:
string strA = "123456";
string strB = "123456";
string strC = "123";
string strD = strC + "456";

strA和strD也是值相同,而引用不同一样,本质上仍然是字符串驻留机制。简单的解释是这样的:字符串驻留机制的核心是CLR内部维护了一个哈希表,对于新创建的字符串会添加到该哈希表中,后面创建的字符串会检索哈希表中的元素,如果找到有相同的字符串则会将之前的字符串引用添加给后创建的字符串变量。这也就是为什么ReferenceEquals(strA, strB)结果为true的原因;而对于动态创建的字符串,例如strD,CLR是不会将其加入哈希表维护的,所以ReferenceEquals(strA, strD)的结果为false。但是String类型提供了Intern方法来将动态创建的字符串添加到哈希表,并返回引用,这就是上述结果的解释。

理解了以上机制,也就基本建立了对字符串驻留的理解,当然详细的过程会更加的复杂。

:-)


--------------------------------------------------------
嗯,清楚了
--引用--------------------------------------------------
Anytao: 做个广告,string类型的特殊性,在《你必须知道的.NET》一书中会有详细而生动的分析,敬请期待:-)
--------------------------------------------------------
啥时出版,一定拜读.
  回复  引用  查看    

#32楼  2008-01-31 17:02 Anytao      
@prong
呵呵,春节之后,2月底吧。谢谢捧场:-)
  回复  引用  查看    

#33楼  2008-02-01 08:49 Annie      
真好!
  回复  引用  查看    

#34楼  2008-02-02 13:00 Annie      
用了一天半的时间连看再抄,感觉真的是很好的东西,谢谢LZ!
  回复  引用  查看    

#35楼  2008-02-05 21:49 fox23      
不错,很深很舒服...
  回复  引用  查看    

有两个关于字符串比较的问题,想请教一下子阳,AnyTao和其他各位高手。

第一个:
-----------------------
public static void Main()
{
string strA = new char[] { 'a', 'b', 'c' }.ToString();
string strB = new char[] { 'a', 'b', 'c' }.ToString();
Console.WriteLine(Object.ReferenceEquals(strA, strB)); //true
Console.WriteLine(strA == strB); //true

strA = new StringBuilder("abc").ToString();
strB = new StringBuilder("abc").ToString();
Console.WriteLine(Object.ReferenceEquals(strA, strB)); //false
Console.WriteLine(strA == strB); //true
}

对于用==来比较两个操作符,是比较各个字符的值,都为true是可以理解的;
但是对于Object.ReferenceEquals的比较,为什么一个为true,另一个为false呢?


第二题:
-----------------------
对与AnyTao的例子,我做了些许更改,如下:
public static void Main()
{
string strA = "abc";
string strB = "a" + "b" + "c";
string temp = "ab";
string strC = temp + "c";
Console.WriteLine(Object.Equals(strA, strB)); //true
Console.WriteLine(Object.Equals(strA, strC)); //true
Console.WriteLine(Object.ReferenceEquals(strA, strB)); //true
Console.WriteLine(Object.ReferenceEquals(strA, strC)); //false
}

对于用Object.Equals进行比较,都为true很容易理解,但是对于用Object.ReferenceEquals进行比较,为什么会不一样呢?难道string strB = "a" + "b" + "c"不属于动态创建字符串,从而会使用驻留在HashTable上的"abc"吗?

希望哪位朋友可以给于回答,谢谢。一直研究字符串比较问题到现在,要去睡觉了,醒来看答案啊!:-)
  回复  引用  查看    

还有一个问题:

public static void Main()
{
string strA = new StringBuilder("abc").ToString();
string strB = new StringBuilder("abc").ToString();
Console.WriteLine(Object.ReferenceEquals(strA, strB)); //false
Console.WriteLine(Object.Equals(strA, strB)); //true
Console.WriteLine(strA == strB); //true

object objA = new StringBuilder("abc").ToString();
object objB = new StringBuilder("abc").ToString();
Console.WriteLine(Object.ReferenceEquals(objA, objB)); //false
Console.WriteLine(Object.Equals(objA, objB)); //true
Console.WriteLine(objA == objB); //false
}

该例子分两部分,第一部分是string类型直接进行比较操作,第二部分是隐式转换成object之后再进行操作。另外,根据AnyTao的说明,new StringBuilder("abc").ToString()产生的字符转属于动态生成的字符串,不会产生驻留现象,故引用肯定不一样。我的问题是:
对于第一部分,为什么第二个比较Object.Equals(strA, strB)是true呢?
对于第二部分,为什么第二个比较也是true,而第三个比较是false?

另外,布置谁能帮我解释一下Object.Equals(object objA, object objB)的实现机制。通过测试,我知道当两个参数是值类型和引用类型的逻辑还是不一样的。但是因为看.Net源代码也看不到它的实现机制,只能看到调用了如下方法:[MethodImpl(MethodImplOptions.InternalCall)]
internal static extern bool InternalEquals(object objA, object objB);
然而对于该方法一无所知。
希望哪位高手帮忙解决一下,谢谢了。

终于要睡觉了:-)

  回复  引用  查看    

对于最后一个问题,我现在想明白了。
因为Object.Equals(object objA, object objB)的代码是:
public static bool Equals(object objA, object objB)
{
return ((objA == objB) || (((objA != null) && (objB != null)) && objA.Equals(objB)));
}

所以最后调用的是实例objA的Equals(object obj)方法,像string类型还有很多简单类型都override了object的Equals(object obj)方法,故实际上
objA.Equals(objB)调用的是实例本身的Equals(object obj)方法。

现在只要帮忙解决前两个问题。
  回复  引用  查看    

#39楼  2008-02-23 13:36 Anytao      
@浮云流水
第一个问题:
产生不同的结果源于String对象是恒定不变的,而StringBuilder对象是可变的;本质上StringBuilder对象维护着一个Char类型数组,正是通过对该内部数组的操作来完成字符串的灵活控制,所以其从本质是有别于String的驻留机制的。所以会产生不同的结果。
第二个问题:
string strA = "abc";
string strB = "a" + "b" + "c";
string temp = "ab";
string strC = temp + "c";
关键还是得回到字符串驻留机制的原理,对于动态创建的字符串,哈希表是不会维护的,在上例中strC是由temp动态创建的对象,所以根本不会在哈希表中进行维护,产生的结果也就不难理解。

最近太忙,解释的有些潦草:-)
  回复  引用  查看    

#40楼  2008-02-23 13:38 Anytao      
--引用--------------------------------------------------
prong: --引用--------------------------------------------------
Anytao: @prong
其实这个问题的解释,本质上还是字符串驻留机制,所以想要探求究竟还是有必要将字符串驻留机制了解清楚才行。

正如:
string strA = "123456";
string strB = "123456";
string strC = "123";
string strD = strC + "456";

strA和strD也是值相同,而引用不同一样,本质上仍然是字符串驻留机制。简单的解释是这样的:字符串驻留机制的核心是CLR内部维护了一个哈希表,对于新创建的字符串会添加到该哈希表中,后面创建的字符串会检索哈希表中的元素,如果找到有相同的字符串则会将之前的字符串引用添加给后创建的字符串变量。这也就是为什么ReferenceEquals(strA, strB)结果为true的原因;而对于动态创建的字符串,例如strD,CLR是不会将其加入哈希表维护的,所以ReferenceEquals(strA, strD)的结果为false。但是String类型提供了Intern方法来将动态创建的字符串添加到哈希表,并返回引用,这就是上述结果的解释。

理解了以上机制,也就基本建立了对字符串驻留的理解,当然详细的过程会更加的复杂。

:-)


--------------------------------------------------------
嗯,清楚了
--引用--------------------------------------------------
Anytao: 做个广告,string类型的特殊性,在《你必须知道的.NET》一书中会有详细而生动的分析,敬请期待:-)
--------------------------------------------------------
啥时出版,一定拜读.
--------------------------------------------------------

之前对该问题做过分析了,可以参考一下:-)

  回复  引用  查看    

谢谢AnyTao的解释。

不过对于我的两个问题,我还有一些地方没有明白:
对与第一个问题
-----------------------
string strA = new char[] { 'a', 'b', 'c' }.ToString();
string strB = new char[] { 'a', 'b', 'c' }.ToString();
Console.WriteLine(Object.ReferenceEquals(strA, strB)); //true

我最主要想知道的是为什么结果会是true。是不是new char[] { 'a', 'b', 'c' }.ToString(); 本质上还是string字符串。


对于第二个问题
-----------------------
我想确认一下,string strB = "a" + "b" + "c";这句代码不算是动态创建字符串吗?

再次感谢AnyTao抽出时间解决我的疑问。
  回复  引用  查看    

#42楼  2008-02-23 16:45 Anytao      
@浮云流水

Question 1:

同样,其实是个你自己绕进去了:-)
string strA = new char[] { 'a', 'b', 'c' }.ToString();
string strB = new char[] { 'a', 'b', 'c' }.ToString();

其实就是:
string strA = "abc";
string strB = "abc";

相当于调用Array.ToString()方法为strA和strB赋值,而
Object.ReferenceEquals(strA, strB)
比较的仍然是两个"abc"的比较,和字符数组无关。

Question 2:
将下面的代码,翻译为IL:
string strA = "abc";
string strB = "a" + "b" + "c";

Console.WriteLine(Object.ReferenceEquals(strA, strB)); //true

string temp = "ab";
string strC = temp + "c";
Console.WriteLine(Object.ReferenceEquals(strA, strC));

对应的IL代码为:
L_0001: ldstr "abc"
L_0006: stloc.0
L_0007: ldstr "abc"
L_000c: stloc.1
L_000d: ldloc.0
L_000e: ldloc.1
L_000f: call bool [mscorlib]System.Object::ReferenceEquals(object, object)
L_0014: call void [mscorlib]System.Console::WriteLine(bool)
L_0019: nop
L_001a: ldstr "ab"
L_001f: stloc.2
L_0020: ldloc.2
L_0021: ldstr "c"
L_0026: call string [mscorlib]System.String::Concat(string, string)
L_002b: stloc.3
L_002c: ldloc.0
L_002d: ldloc.3
L_002e: call bool [mscorlib]System.Object::ReferenceEquals(object, object)
L_0033: call void [mscorlib]System.Console::WriteLine(bool)

可见:
string strA = "abc";
string strB = "a" + "b" + "c";
本质上是一样的;

string temp = "ab";
string strC = temp + "c";
会动态调用String::Concat方法进行创建,
这是二者的区别。

希望我的回答能够让你满意,《你必须知道的.NET》一书将对此有详细的讨论:-)
  回复  引用  查看    

#43楼  2008-02-23 23:13 浮云流水      
对于第二个问题,我已经明白了。谢谢AnyTao。

对于第一个问题,好像问题的本质还没有解释清楚。经过思考,然后我举了一些例子测试,对于类似于一下格式的两个字符串strA和strB,
string strA = instantA.ToString();
string strB = instantB.ToString();
得出以下结论:
如果其中instantA和intantB是简单类型,那么Object.ReferenceEquals(strA, strB)为false;
如果其中instantA和intantB是是引用类型,那么Object.ReferenceEquals(strA, strB)为true,但是StringBuilder除外。(这是一个很特殊的情况,我看了StringBuilder的ToString方法,虽然没看懂,但觉的很特殊,不和其他的一样,呵呵) 另外我发现,instantA和instantB是否指向同一个实例并不会影响结果。

我做了快一年的测试,所以可能总会想一些比较特殊的情况,呵呵。对于第二个问题,我自己还是不太能够找到最终的原因,希望AnyTao能再帮我解释一下。谢谢了。
  回复  引用  查看    

#44楼 [楼主] 2008-02-24 13:53 张子阳.      
@浮云流水
很抱歉,对于String,我没有做太深入的研究。目前只是知道:string 类型覆盖了基类的 Equals() 方法,对于String 类型的比较,如果是调用Equals()方法(这个与直接使用“==”是完全一样的),内部是调用EqualHelper()方法对字符串包含的每个字符进行一对一比较。而如果是调用基类的Object.ReferenceEquals()进行比较,则需要考虑是否进行了字符串驻留,根据是否存在字符串驻留来判断输出。而关于字符串的驻留机制,Anytao同学已经在上面给了说明及示例。

关于你提到的
string strA = new char[] { 'a', 'b', 'c' }.ToString();
string strB = new char[] { 'a', 'b', 'c' }.ToString();
以及:
string strA = instantA.ToString();
string strB = instantB.ToString();

我觉得关键问题是在 ToString() 方法是如何对 instantA 进行处理的,然后再考虑是否进行了字符串驻留。

对于
string strA = new char[] { 'a', 'b', 'c' }.ToString();
string strB = new char[] { 'a', 'b', 'c' }.ToString();
相当于:
string strA = "System.Char[]";
string strB = "System.Char[]"; // 你可能以为返回"abc",但是不会这样。因为 new char[]{a,b,c} 返回一个System.Array的引用类型,该引用类型指向了你创建的 char[] 数组,而 System.Array 没有覆盖基类的 ToString()方法,所以会打印类型名称。

按照 Anytao 举的例子,这里需要考虑到字符串的驻留机制,所以,不管是 ReferenceEquals() 还是 Equals() 都返回了了 True。

我们再看一个例子,即是你说的 instantA 于 instantB 都是值类型的情况。
string strA = 'a'.ToString();
string strB = 'a'.ToString();

Console.WriteLine(ReferenceEquals(strA, strB)); // false;
Console.WriteLine(strA.Equals(strB)); //返回true

这里 'a' 是 char类型,也就是简单类型,ReferenceEquals()为什么返回false,还是要看ToString()对于'a'是如何处理的,用reflactor看一下System.Char的ToString()方法就知道了:
string strA = 'a'.ToString(); 相当于
string strA = new string('a', 1);
可见,它使用new 关键字创建了一个新实例,所以没有字符串驻留在里面。

对于引用类型,我想也是一样的道理,但我目前还没有找到很好的例子来说明。


  回复  引用  查看    

#45楼  2008-02-24 19:53 浮云流水      
@张子阳.
谢谢子阳同学细心回答。

开始我以为new char[]{a,b,c}.ToString()返回"abc",后来我知道它只是返回一个System.Array[]。因为正如你说,new char[]{a,b,c}生成的是一个System.Array的引用类型。
其实我对与ToString的问题已经在上面做了总结:
--引用--------------------------------------------------
对于第一个问题,好像问题的本质还没有解释清楚。经过思考,然后我举了一些例子测试,对于类似于一下格式的两个字符串strA和strB,
string strA = instantA.ToString();
string strB = instantB.ToString();
得出以下结论:
如果其中instantA和intantB是简单类型,那么Object.ReferenceEquals(strA, strB)为false;
如果其中instantA和intantB是是引用类型,那么Object.ReferenceEquals(strA, strB)为true,但是StringBuilder除外。(这是一个很特殊的情况,我看了StringBuilder的ToString方法,虽然没看懂,但觉的很特殊,不和其他的一样,呵呵) 另外我发现,instantA和instantB是否指向同一个实例并不会影响结果。
--------------------------------------------------------

其实我大概知道,所有值类型(自定义的struct除外),都override了Object.ToString方法,包括StringBuilder;而引用类型的ToString方法和Object.ToString的逻辑是一样的(我不确认是不是override了基类的方法,但逻辑是一样的)。所以现在的问题是Object.ToString方法是如何实现的。
然而,看不到代码 :-(

希望能够有更深入的了解。
  回复  引用  查看    

#46楼  2008-03-06 22:56 arlang [未注册用户]
楼主的文章相当不错!娓娓道来,深入浅出!而且考虑很周到!
  回复  引用