从CLR GC到CoreCLR GC看.NET Core对云原生的支持

内存分配概要

前段时间在园子里看到有人提到了GC学习的重要性，很赞同他的观点。充分了解GC可以帮助我们更好的认识.NET的设计以及为何在云原生开发中.NET Core会占有更大的优势，这也是一个程序员成长到更高层次所需要经历的过程。在认识GC的过程中，我们先看一下.NET中内存分配的概要知识。
.NET分配内存，主要依据托管资源和非托管资源进行分配。托管资源分配到了托管堆中并受CLR的管理，非托管资源分配到了非托管堆中。该节主要讨论托管资源的分配。
CLR支持两种基本类型：值类型和引用类型。CLR对这两种类型在运行时有两种分配方式：

内存的分配过程如下图所示

需要注意的是，CLR还要维护一个指针，称为NextObjPtr，这个指针指向下一个对象再堆中的分配位置。初始化时，NextObjPtr设为地址空间区域的基地址。一个区域被非垃圾对象填满后，CLR会分配更多的区域，指针也会不断偏移。new操作符会返回对象的引用，就在返回这个引用之前，NextObjPtr指针的值会加上对象占用的字节数来得到一个新值，即下一个对象放入托管堆时的地址。

垃圾回收算法与GC运行机制

常用的垃圾回收算法主要有引用计数算法和引用跟踪算法。引用计算有着明显的缺陷，.NET使用的垃圾回收算法是引用跟踪法。小记：关于垃圾回收算法，我记得有一个知识点，在C#中如果出现了循环引用是否会导致内存溢出？如果比较了解这两种算法就会知道不会溢出。

GC Root

引用跟踪算法，通过一系列GCRoot对象作为起始点，从这些点开始向下搜索，搜索的路径成为引用链，当一个对象到GC没有任何引用链，说明对象可以被回收。

GC Root可以类比树来解释

GC根节点存在于堆栈中，指向Teacher引用对象。它包含一个ArrayList订单集合，由Teacher对象引用。集合本身也包含对其元素的引用，随着搜索深度的增加，树也不断长大。

GC根节点的引用源来自

(1)、堆栈
(2)、全局或静态变量
(3)、CPU寄存器
(4)、互操作引用（COM / API调用中使用的.NET对象）
(5)、对象终结引用(objects finalization references)

GC运行机制

GC引入了代的概念，分为三种代，G0、G1、G2，G0对象生存周期较短，越往后生存周期越长(虽然G2中由于直接存储了大对象，又由于G2不是每次都会扫描，所以大多数情况下，G2中的对象的生存周期比G0中的更长)。

GC运行如下图所示

需要注意的是，CLR想要进行垃圾回收时，会立即挂起执行托管代码中的所有线程，正在执行非托管代码的线程不会挂起。所以再多线程环境下，可能会出现莫名其妙的诡异问题。

下图为GC的整体运行流程，包含五个步骤：

垃圾回收时机与模式

CLR会在一下情况发生时，执行GC操作

1、当GC的代的预算大小已经达到阈值而无法对新对象分配空间的时候，比如GC的第0代已满；

　　2、显式调用System.GC.Collect()(显示调用要慎重，因为手动调用可能会与自动执行的GC冲突，从而导致无法预知的问题)；

　　3、其他特殊情况，比如，操作系统内存不足、CLR卸载AppDomain、CLR关闭，甚至某些极端情况下系统参数设置改变也可能导致GC回收。

关于GC模式主要有

WorkStation GC
Server GC
Concurrent GC
Non-Concurrent GC
Background GC

详细信息请参阅：https://www.cnblogs.com/dacc123/p/10980718.html，这篇文章关于GC模式的说明比较详细。

.NET Core 3.0中的GC优化处理

.NET Core 3.0默认更好的支持Docker资源限制，官方团队也在努力让.NET Core成为真正的容器运行时，使其在低内存环境中具有容器感知功能并高效运行。

GC堆限制

.NET Core减少了CoreCLR默认使用的内存，如G0代内存分配预算，以更好地与现代处理器缓存大小和缓存层次结构保持一致。

在新的创建的GC堆数量的策略里，GC保留了一个内存片段，每个堆最小是16M，在低内存限制的机器上也可以很好的运行。在多核CPU的机器上运行时，系统并没有设置CPU的核数限制。例如，如果在48核计算机上设置160 MB内存限制，则不需要创建48个GC堆。也就是说如果设置160 MB限制，则只会创建10个GC堆。如果未设置CPU限制，应用程序可以利用计算机上的所有核心。

有了这样的新策略，可以不需要启用Docker环境下的.NET Core应用的工作站GC的工作负载。

支持Docker内存限制

Docker资源限制建立在cgroup之上，而cgroup是Linux的内核功能。从运行时的角度来看，我们需要定位cgroup原语。

设置cgroup限制时的.NET Core 3.0内存使用规则：

默认GC堆大小：容器上cgroup内存限制的最大值20MB或最大值的75%
每个GC堆的最小保留段大小16MB，这将减少在具有大量内核和小内存限制的计算机上创建的堆数

为了支持容器方案，添加了2个HardLimit配置：

GCHeapHardLimit - 指定GC堆的硬限制
GCHeapHardLimitPercent - 指定允许此进程使用的物理内存的百分比

如果同时指定了两者，则首先检查GCHeapHardLimit，并且只有在未指定GCHeapHardLimit时才检查GCHeapHardLimitPercent。

如果两者都未指定，但进程正在有内存限制的容器中运行，则默认是使用如下设置：

max（20mb，容器内存限制的75％）

如果指定了hardlimit配置，并且程序在有内存限制的容器中使用，GC堆的使用不会超过hardlimit限制，但总内存仍然受容器的内存限制。所以当我们统计内存消耗时，基于容器内存限制得出的数据。

举例：

进程在设置了200MB限制的容器中运行，用户还将GCHeapHardLimit配置为100MB。

如果把GC限制中100MB限制中的50MB用于GC，而容器限制中剩余的100MB用于其他用途，那么内存消耗即为(50+100)/200=75%。

GC将更积极地执行资源回收与释放，因为GC堆越接近GCHeapHardLimit限制，就越能实现提供更多可用内存的目标，也越能使得应用程序可以继续而又安全地运行。如果算法计算出的结果认为此时的GC效率低下，那么将避免持续执行完全阻塞的GC。

即使GC堆完全压缩，GC依然会抛出一个OutOfMemoryException异常出来，这是因为所分配的堆大小超过了GCHeapHardLimit的限制。

由此可见，.NET Core 3.0的设计是要稳定运行于有资源限制的容器中。

支持DockerCPU限制

在CPU限制的情况下，Docker上设置的值将向上舍入为下一个整数值。此值是CoreCLR使用的最大有效CPU核数。

默认情况下，ASP.NET Core应用程序启用了服务器GC（它不适用于控制台应用程序），因为它可以实现高吞吐量并减少跨核心的争用。当进程仅限于单个处理器时，运行时会自动切换到工作站GC。即使您明确指定使用服务器GC，工作站GC也将始终用于单核环境。

通过计算CPU繁忙时间，设置CPU限制，我们避免了线程池的各种推导性竞争：

尝试分配更多的线程以增加CPU繁忙时间
尝试分配更少的线程，因为添加更多的线程不会提高吞吐量

参考资料：

https://devblogs.microsoft.com/dotnet/using-net-and-docker-together-dockercon-2019-update/

https://github.com/dotnet/designs/blob/master/accepted/support-for-memory-limits.md

https://www.cnblogs.com/dacc123/p/10980718.html

https://blog.csdn.net/koudaidai/article/details/7794793

posted @ 2019-06-18 09:45 艾心❤ 阅读(3944) 评论(14) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

艾心

努力写出高质量的文章，走心、不忽悠，只为共同进步

从CLR GC到CoreCLR GC看.NET Core对云原生的支持

内存分配概要

垃圾回收算法与GC运行机制

GC Root

GC运行机制

垃圾回收时机与模式

WorkStation GC

Server GC

Concurrent GC

Non-Concurrent GC

Background GC

.NET Core 3.0中的GC优化处理

GC堆限制

支持Docker内存限制

支持DockerCPU限制