粗略理解C#里 dictionary,HashTable,List<T>,Array的性能区别和实现原理。

基于昨天在一家公司面试的惨败，今早特地睡不着就早早爬起来，钻研前人对集合的理解，这文很多都是抄的，就当记忆记忆。
首先这四个大致可以分为两类，第一类是list和array，第二类是dictionary和hashtable。
1.list和array
在《Effective C#》中有这样一条规则，就是说：在初始化List之前最好对List初始化大小。
在初始化List时，List会新建一个数组，然后把数组的长度设置为原来的二倍（如果原有的数组长度为0，那就默认将数组的长度设置为4）。

List<T>是对Array的进一步封装，说得再直接点，我愿意理解List<T>为Array的可扩充版本，然后扩展了一些方法;
List是基于Array存在的，因此，在创建一个List对象时，需要耗费比Array相对更多的时间，以及更大的空间，因为List除了初始化内部的items外还需要初始化一些其他的属性。而且在方法调用时，这点我没有证实，只是一个猜测，List需要的是再去调用Array的相关方法，因此也许会存在方法调用的时间消耗问题。
总结：如果初始化时确定大小，那么就使用Array。如果初始化时不确定大小，那么就使用List。当然，其实完全可以自己去实现List中的数组扩充功能的，也许会更棒，因为我们没有必要去将Array每次都扩充为原来的二倍。
Array相对于List还有个优势就是：多维数组比List的嵌套更容易理解，也就是说int[][]（或者是int[,]）要强于List<list>，也就说在类型确定且多维的情况下，用Array要优于List。

2.dictionary和hashtable的区别
首先很多人都认同一个观点，说Dictionary<T1,T2>是HashTable的泛型版本，这一点在大致上是正确的。
Hashtable是线程安全的，而Dictionary明显不具备如此特性。
说到字典，我们就不能不说其存储结构，他会根据Key通过Hash计算来得到其应存放的虚拟内存地址，这也是在哈希表中Key必须唯一的原因，当我们按照Key进行查找时，首先就是根据Key计算出其所存放的虚拟内存地址，去对应的内存地址找数据，得到其Value。这一点HashTable与其相同。

3.第一类是list和array，第二类是dictionary和hashtable对比
同样是集合，为什么性能会有这样的差距。我们要从存储结构和操作系统的原理谈起。
首先我们清楚List<T>是对数组做了一层包装，我们在数据结构上称之为线性表，而线性表的概念是，在内存中的连续区域，除了首节点和尾节点外，每个节点都有着其唯一的前驱结点和后续节点。我们在这里关注的是连续这个概念。
而HashTable或者Dictionary，他是根据Key而根据Hash算法分析产生的内存地址，因此在宏观上是不连续的，虽然微软对其算法也进行了很大的优化。
由于这样的不连续，在遍历时，Dictionary必然会产生大量的内存换页操作，而List只需要进行最少的内存换页即可，这就是List和Dictionary在遍历时效率差异的根本原因。
Dictionary的存储空间问题，在Dictionary中，除了要存储我们实际需要的Value外，还需要一个辅助变量Key，这就造成了内存空间的双重浪费。
而且在尾部插入时，List只需要在其原有的地址基础上向后延续存储即可，而Dictionary却需要经过复杂的Hash计算，这也是性能损耗的地方。

内容取自：http://blog.csdn.net/teresa502/article/details/8266878和http://www.cnblogs.com/kym/archive/2009/03/09/1406657.html 感谢大神们的教诲我大致了解了。
然后是第一次乱抄，看的不顺直接看原文吧。

posted @ 2016-03-01 09:34 airtcp 阅读(796) 评论(0) 收藏举报

刷新页面返回顶部

airtcp

粗略理解C#里 dictionary,HashTable,List<T>,Array的性能区别和实现原理。

公告