菜鸟之旅——.NET垃圾回收机制

　　.NET的垃圾回收机制是一个非常强大的功能，尽管我们很少主动使用，但它一直在默默的在后台运行，我们仍需要意识到它的存在，了解它，做出更高效的.NET应用程序；下面我分享一下我对于垃圾回收机制（GC）的学习心得。

GC的必要性

　　我们知道程序会需要向内存堆使用new请求内存，然后将请求的内存初始化并使用，使用完毕之后，变清理资源和释放内存，等待别的程序来请求使用；对内存资源的管理方式，现在存在这么几种管理方式：

　　1、手动管理：C、C++

　　2、计数管理：COM

　　3、自动管理：.NET、JAVA、PHP

　　现在的高级语言基本上都实现了自动管理内存，这是因为手动管理内存会因为人为的原因产生以下问题：

　　1、开发人员忘记释放请求的内存，造成内存泄漏，若是内存泄露过多，则可能会造成内存溢出，导致程序无法运行；

　　2、应用程序访问已释放的内存，造成数据读取错误。

　　由此可见，手动去管理堆里面的内存可靠程度，会因开发人员的不同而不同，在C++因指针而出现的问题可不少；而且易出现Bug等乱七八糟的问题，影响系统稳定性，所以自动化管理内存是必要的。

GC的工作原理

　通用概念

　　回收时机

　　当应用程序分配新的对象，GC的代的预算大小已经达到阈值，比如GC的第0代已满；

　　代码主动显式调用System.GC.Collect()；

　　其他特殊情况，比如，windows报告内存不足、CLR卸载AppDomain、CLR关闭，甚至某些极端情况下系统参数设置改变也可能导致GC回收。

　　应用程序根

　　应用程序根（application root）：根（root）就是一个存储位置其中保存着对托管堆上一个对象的引用，根可以属性下面任何一个类别

全局对象和静态对象的引用
应用程序代码库中局部对象的引用
传递进一个方法的对象参数的引用
等待被终结（finalize，后面介绍）对象的引用
任何引用对象的CPU寄存器

　　代

　　垃圾回收器将托管堆(heap)里面的对象划分为3个代（一般为3代），可以使用GC.MaxGeneration()方法来进行查询当前系统所支持的最大代数：

　　1、G0 小对象(Size<85000Byte)：新分配的小于85000字节的对象

　　2、G1:在GC中幸存下来的G0对象

　　3、G2:大对象(Size>=85000Byte);在GC中幸存下来的G1对象

　　当一个对象被new的时候，它的代为0，经过一次回收之后，若该对象没有被回收，则代上升，变为1，若每次回收都幸存下来，则代都会上升，最大代为操作系统所支持的最大代。

　　因为将对象以代划分，并且可以单独回收某一个世代，避免回收整个托管堆，提升性能。一个基于代的垃圾回收器有一下特点：

　　1、对象越新，生存期越短；

　　2、对象越老，生存期越长；

　　3、回收堆的一部分，速度快于回收整个堆。

　工作过程

　　标记对象

　　在垃圾回收的第一步就是标记对象：垃圾回收器会认为托管堆中的所有对象都是垃圾，然后垃圾回收器会去检查所有的应用程序根，遍历每个根所引用到的对象，将其标记为活动的（live ），所有的根对象都检查完之后，有标记的对象就是可达对象，未标记的对象就是不可达对象，不可达对象就是回收的目标。

　　弱引用对象则不在考虑范围之内，所以一定会被回收掉的。

　　销毁对象，释放内存

　　在经过第一步的对象筛选之后，回收没有被引用的对象，就是不可达对象，GC调用对象默认的终结器Finalize()，销毁对象之后，将内存也释放掉。

　　同时，还存在引用的对象，就是可达对象的世代变为下一个世代。

　　压缩堆内存

　　经过第二步的销毁对象和释放内存之后，幸存下来的对象在堆中的排列可能是不连续的，这时在堆中存在非常多的内存碎片，程序在new对象的时候都是请求一段连续的内存，则内存碎片可能就无法再次利用（虽然没有被使用），造成内存资源的浪费，所以垃圾回收的最后一步就是压缩内存：将垃圾回收后幸存的对象移动到一起，并且将各个对象的引用更新到对象新的位置上，保证对象引用的正确性。

　　注：从这里看得出，在压缩堆内存的时候，所有相关线程必须暂停，因为压缩时不能保证对象引用的正确性，所以在垃圾回收的时候，GC会劫持所有相关线程，在回收完毕之后，被劫持的线程才会正常工作，所以垃圾回收势必会影响一定的性能，所以慎用System.GC.Collect()。

　Finalize()与Dispose()

　　上面说到，GC在回收对象的时候是调用对象的终结器Finalize()来实现的，那么，就简单的总结一下Finalize()与Dispose()吧：

　　1、调用者：

　　　　Finalize只能由GC调用

　　　　Dispose由开发人员显示调用，也可以使用use区块，在程序离开区块使自动调用Dispose方法

　　2、调用时机：

　　　　Finalize由于是GC调用的，所以调用时机是垃圾回收的时候调用，时机不确定

　　　　Dispose由于是显示调用，所以调用时机是确定的，在调用方法的时候就调用了

　　3、目的：

　　　　这里的目的主要说是Dispose出现的目的；

　　　　首先是.NET存在托管资源和非托管资源，一般来说，非托管资源数量有限，比较珍贵，在使用完毕之后，希望能够释放掉，那么将释放非托管资源的方法写到终结器Finalize里面也是可以的，但是由于Finalize的调用时机不确定，导致释放资源不及时，那么有限的非托管资源很快就被占用完毕，所以，为了能够及时的释放掉这类资源，我们需要能够显示调用的方法，这就是Dispose。

　　　　Finalize主要是为了GC释放托管资源和销毁对象，释放内存

　　　　Dispose主要是为了释放托管和非托管资源和销毁对象，释放内存

　　注：不必担心资源的重复释放问题，就算是重复释放，.NET也做好了相应措施来处理，不会抛出异常。

　　　　下面贴一个MSDN推荐的标准的Dispose实现方式

    class Class : IDisposable
    {
        // 标识：是否释放托管资源
        private bool disposed = false;

        // 显示调用的方法
        public void Dispose()
        {
            Dispose(true);
            // 将对象从垃圾回收器链表中移除，
            // 从而在垃圾回收器工作时，只释放托管资源，而不执行此对象的析构函数
            GC.SuppressFinalize(this);
        }

        // 受保护的释放资源方法
        protected virtual void Dispose(bool disposing)
        {
            if (!this.disposed)
            {
                if (disposing)
                {
                    // 此处写释放托管资源的方法
                }
                disposed = true;

                // 此处写释放非托管资源的方法
            }
        }
        ~Class()
        {
            // 这里是防止忘记显示调用Dispose()，在GC进行垃圾回收的时候进行释放非托管资源
            Dispose(false);
        }
    }

View Code

总结

　　GC所带来的便利是不言而喻的，但是这是付出一定的系统性能来实现的：在垃圾回收的时候GC会劫持所有相关的线程，并且会有一定的时空开销，所以在平时开发过程中注意一些良好的开发习惯可能会对GC有一些积极的影响。

　　1、尽量不要new很大的对象，大对象（>=85000Byte）直接归为G2代，GC回收算法从来不对大对象堆（LOH）进行内存压缩整理，移动大对象将会消耗更多的CPU时间，也更容易造成内存碎片。这里也可以将大对象或者生命周期长的对象进行池化。

　　2、不要频繁的new生命周期短的小对象，这可能会导致频繁的垃圾回收，这里可以考虑使用结构体放在栈中来代替，或者也可以使用对象池化来优化。

　　3、不推荐使用对象池化的解决方案，它比较笨重和容易出错，设计一个高性能稳定的对象池并不容易。

　　4、降低对象之间的纵向深度，GC在回收过程中，会先顺着根来进行对象遍历和标记，减少深度可以加快遍历速度；若系统中各个类之间的关系错综复杂，那么考虑一下设计方案是否合理。

　　当然注意的地方还有不少，最后贴一篇博客，这里介绍了如何编写高性能的.NET代码，其中的GC介绍非常详细：

　　[翻译]【目录】编写高性能 .NET 代码

posted on 2018-02-28 17:27 愉悦的绅士阅读(1119) 评论(3) 收藏举报

刷新页面返回顶部

愉悦的绅士