C#字符串与享元(Flyweight)模式

写这个文章,主要是因为网上对C#字符串和享元模式的误解比较多。

Flyweight模式

先说这名字,fly呢,就是苍蝇,没错这里面不是飞的意思,是苍蝇的意思,weight大家都知道,就是重量,苍蝇的重量,就是非常非常轻的意思。所以Flyweight模式就是处理非常非常轻量级对象的一个东西。

Flyweight的目标是解决大量细粒度对象的内存消耗问题,当然,巧妇难为无米之炊,任何模式和手法都不能凭空造出内存来,所以享元模式针对的情况是这些细粒度对象的中数据有重复的情况。

Flyweight的做法是,把对象的状态(通常用属性表示),分成两个部分,一部分是内部状态,另一部分是外部状态。内部状态是不易重复的(或者说必要的),外部状态是易重复的。所以,Flyweight把外部状态提取出来共享,这样就一定程度解决了内存占用问题。

C#中的字符串不是Flyweight模式

在网上常常可以看到一个说法,说C#中的字符串使用了Flyweight模式,开门见山地说,这个说法是错误的。

错在哪里呢?按照上文的介绍,错就错在字符串它没有所谓的“内部状态”。

通常讲字符串是享元的原因就是以下代码:

string a = "Hello World";
Console.WriteLine(Object.ReferenceEquals(a, "Hello World")); //True

当使用字符串直接量的时候,不论你写了多少个"Hello World",最终内存里面只有一个字符串对象。

运行时创建的字符串并不在此列,可以使些手段,强制在内存里面产生新的字符串。

string a = "Hello World";
Console.WriteLine(Object.ReferenceEquals(a, new String("Hello World".ToCharArray())));  //False

因为我们强行调用了new,所以这个字符串跟内存中的直接量"Hello World"对应的对象不是同一个。

有趣的是,C#还允许强制把一个字符串加入到(如果已经有了,就只是找出来)字符串池里面。

string a = "Hello World";
string b = String.Intern(new String("Hello World".ToCharArray()));
Console.WriteLine(Object.ReferenceEquals(a,b) );   

或者

string a = String.Intern(new String("Hello World".ToCharArray()));
string b = String.Intern(new String("Hello World".ToCharArray()));
Console.WriteLine(Object.ReferenceEquals(a,b) );

前面提到了,这个行为跟Flyweight使用的内部状态和外部状态不同,是两个对象实实在在就是同一个对象。

C#中的字符串与Flyweight模式

好吧,前面说了不少,C#中的字符串不是Flyweight模式,但是是不是就意味着C#里面字符串跟Flyweight没有关系呢?

当然不是,否则我写这么一篇文章岂不是太蛋疼了……

字符串池和Intern方法简直是实现Flyweight的神器啊!

考虑我们有某一类对象,可能会创建几百万个,对象里面恰巧有这么一个属性叫做颜色,它在对象构造的时候随机产生,颜色用的是rgb色,用rgb24来表示,于是颜色字符串类似#ccc这样子。

代码写起来就像下面的样子:

    class Element
    {
	static Random rnd = new Random();
	static char[] table;
	static Element() 
	{
	    table = "0123456789abcdef".ToCharArray();
	}

	public string color;
	public Element()
	{
	    color = "" + table[rnd.Next() % 16] + table[rnd.Next() % 16] + table[rnd.Next() % 16];
	}
    }

接下来我们创建3千万个对象看看如何

	    Element[] eles = new Element[30000000];
	    for (var i = 0; i < 30000000; i++)
	    {
		eles[i] = new Element();
	    }

从任务管理器看到一大块内存被吃掉了

QFOMR9}(NR%(T3`V3Q35MSY

接下来我们使用String.Intern来实现Flyweight:

    class Element
    {
	static Random rnd = new Random();
	static char[] table;
	static Element() 
	{
	    table = "0123456789abcdef".ToCharArray();
	}

	public string color;
	public Element()
	{
	    color = String.Intern("" + table[rnd.Next() % 16] + table[rnd.Next() % 16] + table[rnd.Next() % 16]);
	}
    }

同样来看看运行结果:


@XMI6L75IKU}S%NGI6L31@K

可以看到内存占用量的明显变化。

因为字符串对象的不可更改性质,使用了String.Intern之后,我们完全看不出前后color的区别,也就是说,修改前后的Element类是完全等效的,但是Flyweight为我们节约了大量的内存。

更多思考

这个典型的使用flyweight场景为我们揭示了享元外部状态的特征:像字符串一样不可更改的对象。GoF原书的例子中的字型对象Glyph也是如此。

String.Intern这种对象池的方式实现flyweight也值得借鉴,我们可以考虑自己设计flyweight的外部状态对象时使用类似的方式。

posted @ 2012-01-21 02:09 winter-cn 阅读(1238) 评论(3) 编辑 收藏

 回复 引用 查看   
#1楼 2012-01-21 09:00 星沙明明      
感觉文章中把内部和外部两种状态的含义说反了。

享元模式中“内部状态”又称“内蕴状态”(Internal State),“外部状态”又称“外蕴状态”(External State)。这两个概念经常容易搞混。

1) 内蕴状态:存储在享元对象内部,不随着环境改变,要以被诸多对象共享。
2) 外蕴状态:一般由客户端指定,并传入享元对象内部,它随着环境进行变化。因此,不可以共享的状态。享元对象的外蕴状态必须由外部保存。

不知理解得是否正确,探讨一下。

 回复 引用 查看   
#2楼[楼主] 2012-01-21 14:17 winter-cn      
@星沙明明
刚查了一下,我确实搞错了,非常感谢指正。

 回复 引用 查看   
#3楼 2012-01-24 22:59 Skolley      
string a = "Hello World";
Console.WriteLine(Object.ReferenceEquals(a, "Hello World")); //True

string a1 = "Hello World";
Console.WriteLine(Object.ReferenceEquals(a1, new String("Hello World".ToCharArray()))); //False

Console.WriteLine(a.GetHashCode());
Console.WriteLine(new String("Hello World".ToCharArray()).GetHashCode());

那为什么这下面的两个哈希值是一样的 ?