垃圾回收机制
怎么判定对象是否为垃圾对象
1.引用计数法
在每个对象中添加一个引用计数器,当有地方引用这个对象的时候,引用计数器就+1,当引用失效的时候,计数器的值就-1。任何时刻计数器为0的对象就是不可能再被使用的。优点:容易实现
缺点:很难解决对象之间相互循环引用的问题
2.可达性分析
  目前的JAVA虚拟机是使用可达性分析算法来判定对象是否存活的,这个算法的基本思路就是通过一系列被称为(GCRoot)的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径成为引用链,当一个对象没有任何引用链相连,则证明此对象是不可用的,回收。
  那些对象可以作为GCRoot?
  (1)虚拟机栈中的引用对象(我们都知道,java虚拟机在调用方法的时候都会创建一个相应的栈帧,栈帧中包含了这个方法内部使用的所有对象的引用,一旦方法执行结束之后,这些临时对象引用也就不复存在了,这些对象就会被垃圾收集器给回收。)
  (2)方法区中的类静态属性引用的对象。 (一般指被static修饰的对象,加载类的时候就加载到内存中。)
  (3)方法区中的常量引用的对象。(final修饰的对象)
  (4)本地方法栈中的JNI(native方法)引用的对象
3.对象死亡需要经过两个过程
 (1)可达性分析后没有发现引用链
 (2)查看对象是否有finalize方法,如果有重写且在方法内完成自救(如再建立引用),还是可以抢救一下。
垃圾清除算法
1.标记清除算法(Mark-Sweep)
实现很简单,第一步对需要回收的对象进行标记,第二步直接清除标记的对象,问题也很明显,会产生内存碎片

2.复制算法(copying)
将内存分为两块区域(运行区域和保留区域),每次只是使用运行区域,垃圾回收时标记所有存活的对象,之后复制到保留区域,然后清空运行区域,最后交换两块空间的角色。
效率高,不会有内存碎片,但是内存利用率低。
3.标记整理算法(Mark-Compact)
首先对需要回收的对象进行标记,把所有存活的对象压缩到内存的另一端,之后清除边界之外所有的对象因为做了一次整理操作,所以垃圾对象清除后,解决内存碎片的问题,同时也不存在空间浪费的问题。但是整理这步操作,本身会消耗资源,甚至如果内存中存活的对象很多,并且都是一些占内存空间较小的对象,要回收的垃圾对象也很少时,垃圾收集器要移动大量的存活对象才能换取少量的内存空间,实在是不划算。

分代回收机制
当前商业虚拟机的垃圾回收器,大多遵循“分代收集”的理论来进行设计,这个理论大体上是这么描述的:a. 绝大部分的对象都是朝生夕死。(新生代)
b. 熬过多次垃圾回收的对象就越难回收。(老年代)
根据以上两个理论,朝生夕死的对象放一个区域,难回收的对象放另外一个区域,这个就构成了新生代和老年代。
   
1.新创建的对象尝试放到eden区,如果该对象比eden区总量都大,那么直接放到老年代。(原因有两点,第一点是大对象需要连续的内存空间,而新生代为了安放大对象可能需要多次进行GC,增加开销;第二点是新生代种伊甸园区和幸存者区常采用复制算法,需要经常复制对象到不同的区域,而大对象在复制时开销较大。)
2.当eden区没有足够的空间时,触发一次minorGC,将eden区和from区存活的对象移动到to区,对象年龄+1(对象头中),然后将eden区和from区进行回收,最后from区和to区互换。
3.如果to区没有足够的空间时,那么将满足条件的对象移入老年代(对象的年龄达到了一定数值 CMS默认6,其他垃圾回收器默认15,这个可以通过-XX:MaxTenuringThreshold=10设置,但是最大值为15)
4.移动过程中老年代空间也不足了,需要回收老年代(majorGC),往往回收老年代时会降整个堆一并回收(fullGC)。
垃圾回收器
  
1.垃圾回收器发展史
有了虚拟机,就一定需要收集垃圾的机制,这就是Garbage Collection,对应的产品我们称为Garbage Collector。1999年随JDK1.3.1一起来的是串行方式的serialGC,它是第一款GC。ParNew垃圾收集器是Serial收集器的多线程版本。
2002年2月26日,Parallel GC和Concurrent Mark Sweep GC跟随JDK1.4.2一起发布。
Parallel GC在JDK6之后成为HotSpot默认GC。
2012年,在JDK1.7u4版本中,G1可用。
2017年,JDK9中G1变成默认的垃圾收集器,以替代CMS。
2018年3月,JDK10中G1垃圾回收器的并行完整垃圾回收,实现并行性来改善最坏情况下的延迟。
2018年9月,JDK11发布。引入Epsilon 垃圾回收器,又被称为 "No-Op(无操作)“ 回收器。同时,引入ZGC:可伸缩的低延迟垃圾回收器(Experimental)。
2019年3月,JDK12发布。增强G1,自动返回未用堆内存给操作系统。同时,引入Shenandoah GC:低停顿时间的GC(Experimental)。
2019年9月,JDK13发布。增强ZGC,自动返回未用堆内存给操作系统。
2020年3月,JDK14发布。删除CMS垃圾回收器。扩展ZGC在macos和Windows上的应用
2.垃圾收集器的组合关系
  
其中Serial old作为CMS出现"Concurrent Mode Failure"失败的后备预案。
(红色虚线)由于维护和兼容性测试的成本,在JDK 8时将Serial+CMS、ParNew+Serial old这两个组合声明为废弃(JEP173),并在JDK9中完全取消了这些组合的支持(JEP214),即:移除。
(绿色虚线)JDK14中:弃用Parallel Scavenge和Serialold GC组合(JEP366)
(青色虚线)JDK14中:删除CMS垃圾回收器(JEP363)
PS:为什么要有很多收集器,一个不够吗?因为Java的使用场景很多,移动端,服务器等。所以就需要针对不同的场景,提供不同的垃圾收集器,提高垃圾收集的性能。
虽然我们会对各个收集器进行比较,但并非为了挑选一个最好的收集器出来。没有一种放之四海皆准、任何场景下都适用的完美收集器存在,更加没有万能的收集器。所以我们选择的只是对具体应用最合适的收集器。
3.如何查看默认垃圾收集器
-XX:+PrintcommandLineFlags:查看命令行相关参数(包含使用的垃圾收集器)
使用命令行指令:jinfo -flag 相关垃圾回收器参数 进程ID
4.Serial回收器:串行回收
最基本、历史最悠久的垃圾回收器,jdk1.3之前唯一新生代回收器。HotSpot中client模式下的默认新生代垃圾收集器。采用复制算法、串行回收和"stop-the-World"机制的方式执行内存回收。
除了年轻代之外,Serial收集器还提供用于执行老年代垃圾收集的Serial old收集器。
Serial old收集器同样也采用了串行回收和"stop the World"机制,只不过内存回收算法使用的是标记-压缩算法。
Serial old是运行在Client模式下默认的老年代的垃圾回收器
Serial 0ld在Server模式下主要有两个用途:
与新生代的Parallel Scavenge配合使用
作为老年代CMS收集器的后备垃圾收集方案
 
 这个收集器是一个单线程的收集器,但它的“单线程”的意义并不仅仅说明它只会使用一个CPU或一条收集线程去完成垃圾收集工作,更重要的是在它进行垃圾收集时,必须暂停其他所有的工作线程,直到它收集结束(Stop The World)
优势:简单而高效(与其他收集器的单线程比),对于限定单个CPU的环境来说,Serial收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。
运行在client模式下的虚拟机是个不错的选择。
在用户的桌面应用场景中,可用内存一般不大(几十MB至一两百MB),可以在较短时间内完成垃圾收集(几十ms至一百多ms),只要不频繁发生,使用串行回收器是可以接受的。
在HotSpot虚拟机中,使用-XX:+UseSerialGC参数可以指定年轻代和老年代都使用串行收集器(新生代用Serial GC,且老年代用Serial old GC)。
5.ParNew回收器:并行回收
ParNew收集器则是serial收集器的多线程版本(Par是Parallel的缩写,New:只能处理的是新生代)ParNew收集器除了采用并行回收的方式执行内存回收外,两款垃圾收集器之间几乎没有任何区别。ParNew收集器在年轻代中同样也是采用复制算法、"stop-the-World"机制。
ParNew是很多JVM运行在Server模式下新生代的默认垃圾收集器。

(ParNew + Serial Old)
对于新生代,回收次数频繁,使用并行方式高效。
对于老年代,回收次数少,使用串行方式节省资源。(CPU并行需要切换线程,串行可以省去切换线程的资源)
在程序中,开发人员可以通过选项"-XX:+UseParNewGC"手动指定使用ParNew收集器执行内存回收任务。它表示年轻代使用并行收集器,不影响老年代。
-XX:ParallelGCThreads限制线程数量,默认开启和CPU数据相同的线程数。
6.Parallel回收器:吞吐量优先
HotSpot的年轻代中除了拥有ParNew收集器是基于并行回收的以外,Parallel Scavenge收集器同样也采用了复制算法、并行回收和"Stop the World"机制。那么这两有什么区别呢?
a. 和ParNew收集器不同,ParallelScavenge收集器的目标则是达到一个可控制的吞吐量(Throughput),它也被称为吞吐量优先的垃圾收集器。
b. 自适应调节策略也是Parallel Scavenge与ParNew一个重要区别。
高吞吐量则可以高效率地利用CPU时间,尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务。因此,常见在服务器环境中使用。例如,那些执行批量处理、订单处理、工资支付、科学计算的应用程序。
Parallel 收集器在JDK1.6时提供了用于执行老年代垃圾收集的Parallelold收集器,用来代替老年代的serialold收集器。
Parallel old收集器采用了标记-整理算法,但同样也是基于并行回收和"stop-the-World"机制。
  
参数配置
-XX:+UseParallelGC 手动指定年轻代使用Paralle1并行收集器执行内存回收任务。
-XX:+UseParalleloldcc 手动指定老年代都是使用并行回收收集器。
分别适用于新生代和老年代。默认jdk8是开启的。上面两个参数,默认开启一个,另一个也会被开启。(互相激活)
-XX:ParallelGcrhreads设置年轻代并行收集器的线程数。一般最好与CPU数量相等,以避免过多的线程数影响垃圾收集性能。
在默认情况下,当CPU数量小于8个,ParallelGcThreads的值等于CPU数量。当CPU数量大于8个,ParallelGCThreads的值等于3+[5*CPU Count]/8]。
-XX:MaxGCPauseMillis 设置垃圾收集器最大停顿时间(即STw的时间)。单位是毫秒。为了尽可能地把停顿时间控制在MaxGCPauseMills以内,收集器在工作时会调整Java堆大小或者其他一些参数。对于用户来讲,停顿时间越短体验越好。但是在服务器端,我们注重高并发,整体的吞吐量。所以服务器端适合Parallel,进行控制。该参数使用需谨慎。
-XX:GCTimeRatio垃圾收集时间占总时间的比例(=1/(N+1))。用于衡量吞吐量的大小。取值范围(0,100)。默认值99,也就是垃圾回收时间不超过1。
与前一个-xx:MaxGCPauseMillis参数有一定矛盾性。暂停时间越长,Radio参数就容易超过设定的比例。
-XX:+UseAdaptivesizepplicy 设置Parallel scavenge收集器具有自适应调节策略
在这种模式下,年轻代的大小、Eden和Survivor的比例、晋升老年代的对象年龄等参数会被自动调整,已达到在堆大小、吞吐量和停顿时间之间的平衡点。
在手动调优比较困难的场合,可以直接使用这种自适应的方式,仅指定虚拟机的最大堆、目标的吞吐量(GCTimeRatio)和停顿时间(MaxGCPauseMil1s),让虚拟机自己完成调优工作。
7.CMS回收器:低延迟
在JDK1.5Hotspot推出了CMS(Concurrent-Mark-Sweep)收集器,是第一款真正意义上的并发收集器,它第一次实现了让垃圾收集线程与用户线程同时工作。CMS收集器的关注点是尽可能缩短垃圾收集时用户线程的停顿时间。停顿时间越短(低延迟)就越适合与用户交互的程序,良好的响应速度能提升用户体验。
CMS的垃圾收集算法采用标记-清除算法,并且也会"stop-the-world"。
不幸的是,CMS作为老年代的收集器,却无法与JDK1.4中已经存在的新生代收集器Parallel Scavenge配合工作,所以在JDK1.5中使用CMS来收集老年代的时候,新生代只能选择ParNew或者Serial收集器中的一个。
在G1出现之前,CMS使用还是非常广泛的。一直到今天,仍然有很多系统使用CMS GC。
如果对JDK9及以上版本的HotSpot虚拟机使用参数-XX:+UseConcMarkSweepGC来开启CMS收集器的话,用户会收到一个警告信息,提示CMS未来将会被废弃。
JDK14移除了CMS垃圾收集器,如果在JDK14中使用-XX:+UseConcMarkSweepGC的话,JVM不会报错,只是给出一个warning信息,但是不会exit。JVM会自动回退以默认GC方式启动JVM
  
  CMS整个过程比之前的收集器要复杂,整个过程分为4个主要阶段(涉及STW的阶段主要是:初始标记 和 重新标记)
  a. 初始标记(Initial-Mark)阶段:在这个阶段中,程序中所有的工作线程都将会因为“stop-the-world”机制而出现短暂的暂停,这个阶段的主要任务仅仅只是标记出GCRoots能直接关联到的对象。一旦标记完成之后就会恢复之前被暂停的所有应用线程。由于直接关联对象比较小,所以这里的速度非常快。
  b. 并发标记(Concurrent-Mark)阶段:从Gc Roots的直接关联对象开始遍历整个对象图的过程,这个过程耗时较长但是不需要停顿用户线程,可以与垃圾收集线程一起并发运行。
  c. 重新标记(Remark)阶段:由于在并发标记阶段中,程序的工作线程会和垃圾收集线程同时运行或者交叉运行,因此为了修正并发标记期间,因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录,这个阶段的停顿时间通常会比初始标记阶段稍长一些,但也远比并发标记阶段的时间短。
  d. 并发清除(Concurrent-Sweep)阶段:此阶段清理删除掉标记阶段判断的已经死亡的对象,释放内存空间。由于不需要移动存活对象,所以这个阶段也是可以与用户线程同时并发的
尽管CMS收集器采用的是并发回收(非独占式),但是在其初始化标记和再次标记这两个阶段中仍然需要执行“Stop-the-World”机制暂停程序中的工作线程,不过暂停时间并不会太长,因此可以说明目前所有的垃圾收集器都做不到完全不需要“stop-the-World”,只是尽可能地缩短暂停时间。
  由于最耗费时间的并发标记与并发清除阶段都不需要暂停工作,所以整体的回收是低停顿的。
  另外,由于在垃圾收集阶段用户线程没有中断,所以在CMS回收过程中,还应该确保应用程序用户线程有足够的内存可用。因此,CMS收集器不能像其他收集器那样等到老年代几乎完全被填满了再进行收集,而是当堆内存使用率达到某一阈值时,便开始进行回收,以确保应用程序在CMS工作过程中依然有足够的空间支持应用程序运行。要是CMS运行期间预留的内存无法满足程序需要,就会出现一次“Concurrent Mode Failure”失败,这时虚拟机将启动后备预案:临时启用Serial old收集器来重新进行老年代的垃圾收集,这样停顿时间就很长了。
  CMS收集器的垃圾收集算法采用的是标记清除算法,这意味着每次执行完内存回收后,由于被执行内存回收的无用对象所占用的内存空间极有可能是不连续的一些内存块,不可避免地将会产生一些内存碎片。那么CMS在为新对象分配内存空间时,将无法使用指针碰撞(Bump the Pointer)技术,而只能够选择空闲列表(Free List)执行内存分配。
   那么CMS为什么不使用标记整理算法?因为当并发清除的时候,用Compact整理内存的话,用户线程运行的资源会受到影响,Mark Compact更适合“stop the world”这种场景下使用
  优点:
    并发收集
    低延迟
  缺点:
	    a. 会产生内存碎片,导致并发清除后,用户线程可用的空间不足。在无法分配大对象的情况下,不得不提前触发FullGC。
	    b. CMS收集器对CPU资源非常敏感。在并发阶段,它虽然不会导致用户停顿,但是会因为占用了一部分线程而导致应用程序变慢,总吞吐量会降低。
	    c. CMS收集器无法处理浮动垃圾。可能出现“Concurrent Mode Failure"失败而导致另一次Full GC的产生。在并发标记阶段由于程序的工作线程和垃圾收集线程是同时运行或者交叉运行的,那么在并发标记阶段如果产生新的垃圾对象,CMS将无法对这些垃圾对象进行标记,最终会导致这些新产生的垃圾对象没有被及时回收,从而只能在下一次执行GC时释放这些之前未被回收的内存空间。
  设置的参数
	  -XX:+UseConcMarkSweepGC手动指定使用CMS收集器执行内存回收任务。开启该参数后会自动将-xx:+UseParNewGC打开。即:ParNew(Young区用)+CMS(01d区用)+Serial old的组合。
	  -XX:CMSInitiatingoccupanyFraction 设置堆内存使用率的阈值,一旦达到该阈值,便开始进行回收。JDK5及以前版本默认老年代的空间使用率达到68%时,会执行一次CMS回收。JDK6及以上版本默认值为92%。如果内存增长缓慢,则可以设置一个稍大的值,大的阀值可以有效降低CMS的触发频率,减少老年代回收的次数可以较为明显地改善应用程序性能。反之,如果应用程序内存使用率增长很快,则应该降低这个阈值,以避免频繁触发老年代串行收集器。因此通过该选项便可以有效降低Ful1Gc的执行次数。
	  -XX:+UseCMSCompactAtFullCollection用于指定在执行完Ful1GC后对内存空间进行压缩整理避免碎片产生,不过由于整理过程无法并发执行,会导致停顿时间变得更长。
	  -XX:CMSFullGCsBeforecompaction 设置在执行多少次Ful1GC后对内存空间进行压缩整理。
	  -XX:ParallelcMSThreads 设置CMS的线程数量。CMS默认启动的线程数是(Paralle1GCThreads+3)/4,ParallelGCThreads是年轻代并行收集器的线程数。当CPU资源比较紧张时,受到CMS收集器线程的影响,应用程序的性能在垃圾回收阶段可能会非常糟糕。
8.G1回收器:区域化分代式
为了适应现在不断扩大的内存和不断增加的处理器数量,进一步降低暂停时间(pause time),同时兼顾良好的吞吐量。G1是一个并行回收器,它把堆内存分割为很多不相关的区域(Region)(物理上不连续的)。使用不同的Region来表示Eden、幸存者0区,幸存者1区,老年代等。
G1 GC有计划地避免在整个Java堆中进行全区域的垃圾收集。G1跟踪各个Region里面的垃圾堆积的价值大小(回收所获得的空间大小以及回收所需时间的经验值),在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的Region。
由于这种方式的侧重点在于回收垃圾最大量的区间(Region),所以我们给G1一个名字:垃圾优先(Garbage First)。
G1是一款面向服务端应用的垃圾收集器,主要针对配备多核CPU及大容量内存的机器,以极高概率满足GC停顿时间的同时,还兼具高吞吐量的性能特征。
在JDK1.7版本正式启用,是JDK9以后的默认垃圾回收器,取代了CMS回收器以及Paralle1+Parallel old组合。
  

  使用G1收集器时,每个Region块大小在1-32M之间,且为2的N次幂,可以通过-XX:G1HeapRegionsize设定。所有的Region大小相同,且在JVM生命周期内不会被改变。JVM官方建议Region数目最大为2048(超过也可以,但可能会有问题),即堆最大为32M*2048=64G。
  虽然还保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离的了,它们都是一部分Region(不需要连续)的集合。通过Region的动态分配方式实现逻辑上的连续。
   一个region只可能属于一个角色。图中的E表示该region属于Eden内存区域,s表示属于survivor内存区域,o表示属于01d内存区域。图中空白的表示未使用的内存空间。
  G1垃圾收集器还增加了一种新的内存区域,叫做Humongous内存区域(图中的H块)。主要用于存储大对象,如果超过0.5个region,就放到old区,old标记为H。大于1个小于n个region,那么n个region连续,标记为H(设置H的原因:对于堆中的对象,默认直接会被分配到老年代,但是如果它是一个短期存在的大对象就会对垃圾收集器造成负面影响。为了解决这个问题,G1划分了一个Humongous区,它用来专门存放大对象。如果一个H区装不下一个大对象,那么G1会寻找连续的H区来存储。为了能找到连续的H区,有时候不得不启动Fu11Gc。G1的大多数行为都把H区作为老年代的一部分来看待)
  每个Region都是通过指针碰撞来分配空间
  先说优点:
    a. 并行性:G1在回收期间,可以有多个GC线程同时工作,有效利用多核计算能力。此时用户线程STW
    b. 并发性:G1拥有与应用程序交替执行的能力,部分工作可以和应用程序同时执行,因此,一般来说,不会在整个回收阶段发生完全阻塞应用程序的情况分代收集
    c. 分代收集:G1依然属于分代型垃圾回收器,它会区分年轻代和老年代,年轻代依然有Eden区和Survivor区。但从堆的结构上看,它不要求整个Eden区、年轻代或者老年代都是连续的,也不再坚持固定大小和固定数量。将堆空间分为若干个区域(Region),这些区域中包含了逻辑上的年轻代和老年代。和之前的各类回收器不同,它同时兼顾年轻代和老年代。
    d.可预测的停顿时间模型(软实时soft real-time):G1除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不得超过N毫秒。由于分区的原因,G1可以只选取部分区域进行内存回收,这样缩小  了回收的范围,因此对于全局停顿情况的发生也能得到较好的控制。优先列表保证了G1收集器在有限的时间内可以获取尽可能高的收集效率。相比于CMSGC,G1未必能做到CMS在最好情况下的延时停顿,但是最差情况要好很多。
    e.空间整理:CMS使用“标记-清除”算法、内存碎片、若干次GC后进行一次碎片整理G1将内存划分为一个个的region。内存的回收是以region作为基本单位的。Region之间是复制算法,但整体上实际可看作是标记-压缩(Mark-Compact)算法,两种算法都可以避免内存碎片。这种特性有利于程序长时间运行,分配大对象时不会因为无法找到连续内存空间而提前触发下一次GC。尤其是当Java堆非常大的时候,G1的优势更加明显。
  其次是缺点:相较于CMS,G1略强但有限。比如在用户程序运行过程中,G1无论是为了垃圾收集产生的内存占用(Footprint)还是程序运行时的额外执行负载(overload)都要比CMS要高。从经验上来说,在小内存应用上CMS的表现大概率会优于G1,而G1在大内存应用上则发挥其优势。平衡点在6-8GB之间。
  G1参数设置
    -XX:+UseG1GC:手动指定使用G1垃圾收集器执行内存回收任务
    -XX:G1HeapRegionSize设置每个Region的大小。值是2的幂,范围是1MB到32MB之间,目标是根据最小的Java堆大小划分出约2048个区域。默认是堆内存的1/2000。
    -XX:MaxGCPauseMillis 设置期望达到的最大Gc停顿时间指标(JVM会尽力实现,但不保证达到)。默认值是200ms
    -XX:+ParallelGcThread 设置STW工作线程数的值。最多设置为8
    -XX:ConcGCThreads 设置并发标记的线程数。将n设置为并行垃圾回收线程数(ParallelGcThreads)的1/4左右。
    -XX:InitiatingHeapoccupancyPercent 设置触发并发Gc周期的Java堆占用率阈值。超过此值,就触发GC。默认值是45。 
  G1操作三步走:开启G1垃圾收集器、设置堆的最大内存、设置最大的停顿时间
  G1中提供了三种垃圾回收模式:YoungGC、Mixed GC和FullGC,在不同的条件下被触发。
  G1收集器的适用场景
    面向服务端应用,针对具有大内存、多处理器的机器。
    需要低GC延迟,并具有大堆的应用程序提供解决方案。
    如:在堆大小约6GB或更大时,可预测的暂停时间可以低于0.5秒;(G1通过每次只清理一部分而不是全部的Region的增量式清理来保证每次Gc停顿时间不会过长)。用来替换掉JDK1.5中的CMS收集器;在下面的情况时,使用G1可能比CMS好:
      超过50%的Java堆被活动数据占用;
      对象分配频率或年代提升频率变化很大;
      GC停顿时间过长(长于0.5至1秒)
    HotSpot垃圾收集器里,除了G1以外,其他的垃圾收集器使用内置的JVM线程执行GC的多线程操作,而G1可以采用应用线程承担后台运行的GC工作,即当JVM的GC线程处理速度慢时,系统会调用应用程序线程帮助加速垃圾回收过程。
G1垃圾回收器的回收过程
- 年轻代GC(Young GC)
- 老年代并发标记过程(Concurrent Marking)
- 混合回收(Mixed GC)
  
(1)应用程序分配内存,当年轻代的Eden区用尽时开始年轻代回收过程;G1的年轻代收集阶段是一个并行的独占式收集器。在年轻代回收期,G1GC暂停所有应用程序线程,启动多线程执行年轻代回收。然后从年轻代区间移动存活对象到Survivor区间或者老年区间,也有可能是两个区间都会涉及。
(2)当堆内存使用达到一定值(默认45%)时,开始老年代并发标记过程。
(3)标记完成马上开始混合回收过程。对于一个混合回收期,G1GC从老年区间移动存活对象到空闲区间,这些空闲区间也就成为了老年代的一部分。和年轻代不同,老年代的G1回收器和其他GC不同,G1的老年代回收器不需要整个老年代被回收,一次只需要扫描/回收一小部分老年代的Region就可以了。同时,这个老年代Region是和年轻代一起被回收的。
Remembered Set(记忆集):无论G1还是其他分代收集器,JVM都是使用Remembered Set来避免全局扫描:每个Region都有一个对应的Remembered Set;每次Reference类型数据写操作时,都会产生一个Write Barrier暂时中断操作;然后检查将要写入的引用指向的对象是否和该Reference类型数据在不同的Region(其他收集器:检查老年代对象是否引用了新生代对象);如果不同,通过CardTable把相关引用信息记录到引用指向对象的所在Region对应的Remembered Set中;当进行垃圾收集时,在GC根节点的枚举范围加入Remembered Set;就可以保证不进行全局扫描,也不会有遗漏。
G1回收过程-年轻代GC
  JVM启动时,G1先准备好Eden区,程序在运行过程中不断创建对象到Eden区,当Eden空间耗尽时,G1会启动一次年轻代垃圾回收过程。
  YGC时,首先G1停止应用程序的执行(stop-The-Wor1d),G1创建回收集(Collection Set),回收集是指需要被回收的内存分段的集合,年轻代回收过程的回收集包含年轻代Eden区和Survivor区所有的内存分段。
  (1)扫描根 (根是指static变量指向的对象,正在执行的方法调用链条上的局部变量等。根引用连同RSet记录的外部引用作为扫描存活对象的入口。)
  (2)更新RSet(此阶段完成后,RSet可以准确的反映老年代对所在的内存分段中对象的引用)
  (3)处理RSet(识别被老年代对象指向的Eden中的对象,这些被指向的Eden中的对象被认为是存活的对象)
  (4)复制对象(此阶段,对象树被遍历,Eden区内存段中存活的对象会被复制到Survivor区中空的内存分段,Survivor区内存段中存活的对象如果年龄未达阈值,年龄会加1,达到阀值会被会被复制到old区中空的内存分段。如果Survivor空间不够,Eden空间的部分数据会直接晋升到老年代空间)
  (5)处理引用(处理Soft,Weak,Phantom,Final,JNI Weak等引用。最终Eden空间的数据为空,GC停止工作,而目标内存中的对象都是连续存储的,没有碎片,所以复制过程可以达到内存整理的效果,减少碎片)  
G1回收过程-并发标记过程
  初始标记阶段:标记从根节点直接可达的对象。这个阶段是STW的,并且会触发一次年轻代GC。
  根区域扫描(Root Region Scanning):G1扫描survivor区直接可达的老年代区域对象,并标记被引用的对象。这一过程必须在youngGC之前完成。
  并发标记(Concurrent Marking):在整个堆中进行并发标记(和应用程序并发执行),此过程可能被youngGC中断。在并发标记阶段,若发现区域中所有对象都是垃圾,那这个区域会被立即回收。同时,并发标记过程中,会计算每个区域的对象活性(区域中存活对象的比例)。
  再次标记(Remark):由于应用程序持续进行,需要修正上一次的标记结果。是STW的。G1中采用了比CMS更快的初始快照算法:snapshot-at-the-beginning(SATB)。
  独占清理(cleanup,STW):计算各个区域的存活对象和GC回收比例,并进行排序,识别可以混合回收的区域。为下阶段做铺垫。是sTw的。这个阶段并不会实际上去做垃圾的收集
  并发清理阶段:识别并清理完全空闲的区域。
G1回收过程 - 混合回收
  当越来越多的对象晋升到老年代old region时,为了避免堆内存被耗尽,虚拟机会触发一个混合的垃圾收集器,即Mixed GC,除了回收整个Young Region,还会回收一部分的old Region。这里需要注意:是一部分老年代,而不是全部老年代。可以选择哪些old Region进行收集,从而可以对垃圾回收的耗时时间进行控制。也要注意的是Mixed GC并不是Full GC。
  并发标记结束以后,老年代中百分百为垃圾的内存分段被回收了,部分为垃圾的内存分段被计算了出来。默认情况下,这些老年代的内存分段会分8次(可以通过-XX:G1MixedGCCountTarget设置)被回收,混合回收的回收集(Collection Set)包括八分之一的老年代内存分段,Eden区内存分段,Survivor区内存分段。混合回收的算法和年轻代回收的算法完全一样,只是回收集多了老年代的内存分段。具体过程请参考上面的年轻代回收过程。
  由于老年代中的内存分段默认分8次回收,G1会优先回收垃圾多的内存分段。垃圾占内存分段比例越高的,越会被先回收。并且有一个阈值会决定内存分段是否被回收,
  XX:G1MixedGCLiveThresholdPercent,默认为65%,意思是垃圾占内存分段比例要达到65%才会被回收。如果垃圾占比太低,意味着存活的对象占比高,在复制的时候会花费更多的时间。
  混合回收并不一定要进行8次。有一个阈值-XX:G1HeapWastePercent,默认值为1e%,意思是允许整个堆内存中有10%的空间被浪费,意味着如果发现可以回收的垃圾占堆内存的比例低于10%,则不再进行混合回收。因为GC会花费很多的时间但是回收到的内存却很少。 
G1回收可选的过程4 - Full GC
  G1的初衷就是要避免FullGC的出现。但是如果上述方式不能正常工作,G1会停止应用程序的执行(stop-The-world),使用单线程的内存回收算法进行垃圾回收,性能会非常差,应用程序停顿时间会很长。
  要避免FullGC的发生,一旦发生需要进行调整。什么时候会发生FullGC呢?比如堆内存太小,当G1在复制存活对象的时候没有空的内存分段可用,则会回退到fullgc,这种情况可以通过增大内存解决。
  导致FullGC的原因可能有两个:
    a. 没有足够的to-space来存放晋升的对象;
    b. 并发处理过程完成之前空间耗尽。
G1的设计问题和建议
从oracle官方透露出来的信息可获知,回收阶段(Evacuation)其实本也有想过设计成与用户程序一起并发执行,但这件事情做起来比较复杂,考虑到G1只是回一部分Region,停顿时间是用户可控制的,所以并不迫切去实现,而选择把这个特性放到了G1之后出现的低延迟垃圾收集器(即ZGC)中。另外,还考虑到G1不是仅仅面向低延迟,停顿用户线程能够最大幅度提高垃圾收集效率,为了保证吞吐量所以才选择了完全暂停用户线程的实现方案。年轻代的大小(避免使用-Xmn或-XX:NewRatio等相关选项显式设置年轻代大小,固定年轻代的大小会覆盖)
暂停时间目标暂停时间目标不要太过严苛 (G1 GC的吞吐量目标是90%的应用程序时间和10%的垃圾回收时间,评估G1GC的吞吐量时,暂停时间目标不要太严苛。目标太过严苛表示你愿意承受更多的垃圾回收开销,而这些会直接影响到吞吐量)
9.垃圾回收器总结
  
  GC发展阶段:Seria l=> Parallel(并行)=> CMS(并发)=> G1 => ZGC
  怎么选择垃圾回收器
    优先调整堆的大小让JVM自适应完成。
    如果内存小于100M,使用串行收集器
    如果是单核、单机程序,并且没有停顿时间的要求,串行收集器
    如果是多CPU、需要高吞吐量、允许停顿时间超过1秒,选择并行或者JVM自己选择
    如果是多CPU、追求低停顿时间,需快速响应(比如延迟不能超过1秒,如互联网应用),使用并发收集器
    官方推荐G1,性能高。现在互联网的项目,基本都是使用G1。
  最后需要明确一个观点:
    没有最好的收集器,更没有万能的收集
    调优永远是针对特定场景、特定需求,不存在一劳永逸的收集器
10.垃圾回收器的新发展
GC仍然处于飞速发展之中,目前的默认选项G1GC在不断的进行改进,很多我们原来认为的缺点,例如串行的FullGC、Card Table扫描的低效等,都已经被大幅改进,例如,JDK10以后,FullGC已经是并行运行,在很多场景下,其表现还略优于ParallelGC的并行FullGC实现。
即使是SerialGC,虽然比较古老,但是简单的设计和实现未必就是过时的,它本身的开销,不管是GC相关数据结构的开销,还是线程的开销,都是非常小的,所以随着云计算的兴起,在serverless等新的应用场景下,Serial Gc找到了新的舞台。
比较不幸的是CMSGC,因为其算法的理论缺陷等原因,虽然现在还有非常大的用户群体,但在JDK9中已经被标记为废弃,并在JDK14版本中移除
Epsilon:A No-Op GarbageCollector(Epsilon垃圾回收器,"No-Op(无操作)"回收器)http://openidk.iava.net/iep s/318
ZGC:A Scalable Low-Latency Garbage Collector(Experimental)(ZGC:可伸缩的低延迟垃圾回收器,处于实验性阶段)
现在G1回收器已成为默认回收器好几年了。我们还看到了引入了两个新的收集器:ZGC(JDK11出现)和Shenandoash(Open JDK12)
11.Open JDK12的Shenandoash GC
  Open JDK12的shenandoash GC:低停顿时间的GC(实验性)
  Shenandoah,无疑是众多GC中最孤独的一个。是第一款不由oracle公司团队领导开发的Hotspot垃圾收集器。不可避免的受到官方的排挤。比如号称openJDK和OracleJDk没有区别的Oracle公司仍拒绝在oracleJDK12中支持Shenandoah。
  Shenandoah 垃圾回收器是 Red Hat 在 2014 年宣布进行的一项垃圾收集器研究项目 Pauseless GC 的实现,旨在针对 JVM 上的内存收回实现低停顿的需求。该设计将与应用程序线程并发,通过交换 CPU 并发周期和空间以改善停顿时间,使得垃圾回收器执行线程能够在 Java 线程运行时进行堆压缩,并且标记和整理能够同时进行,因此避免了在大多数 JVM 垃圾收集器中所遇到的问题。
  Shenandoah GC 主要目标是 99.9% 的暂停小于 10ms,暂停与堆大小无关等。
  Shenandoah GC工作原理:
    其内存结构与 G1 非常相似,都是将内存划分为类似棋盘的region。整体流程与 G1 也是比较相似的,最大的区别在于实现了并发的 疏散(Evacuation) 环节,引入的 BrooksForwarding Pointer 技术使得 GC 在移动对象时,对象引用仍然可以访问。
     
  
  Init Mark 启动并发标记阶段:
    (1)并发标记遍历堆阶段
    (2)并发标记完成阶段
    (3)并发整理回收无活动区域阶段
    (4)并发 Evacuation 整理内存区域阶段
    (5)Init Update Refs 更新引用初始化 阶段
    (6)并发更新引用阶段
    (7)Final Update Refs 完成引用更新阶段
    (8)并发回收无引用区域阶段
  配置或调试 Shenandoah 的 JVM 参数:
    -XX:+AlwaysPreTouch:使用所有可用的内存分页,减少系统运行停顿,为避免运行时性能损失。
    -Xmx == -Xmsv:设置初始堆大小与最大值一致,可以减轻伸缩堆大小带来的压力,与 AlwaysPreTouch 参数配合使用,在启动时提交所有内存,避免在最终使用中出现系统停顿。
    -XX:+ UseTransparentHugePages:能够大大提高大堆的性能,同时建议在 Linux 上使用时将/sys/kernel/mm/transparent_hugepage/enabled 和/sys/kernel/mm/transparent_hugepage/defragv 设置为:madvise,同时与 AlwaysPreTouch 一起使用时,init 和 shutdownv 速度会更快,因为它将使用更大的页面进行预处理。
    -XX:+UseNUMA:虽然 Shenandoah 尚未明确支持 NUMA(Non-Uniform Memory Access),但最好启用此功能以在多插槽主机上启用 NUMA 交错。与 AlwaysPreTouch 相结合,它提供了比默认配置更好的性能。
    -XX:+DisableExplicitGC:忽略代码中的 System.gc() 调用。当用户在代码中调用 System.gc() 时会强制Shenandoah 执行 STW Full GC ,应禁用它以防止执行此操作,另外还可以使用 -
    -XX:+ExplicitGCInvokesConcurrent,在 调用 System.gc() 时执行 CMS GC 而不是 Full GC,建议在有System.gc() 调用的情况下使用。不过目前 Shenandoah 垃圾回收器还被标记为实验项目,如果要使用Shenandoah GC需要编译时--with-jvmfeatures选项带有shenandoahgc,然后启动时使用参数
    -XX:+UnlockExperimentalVMOptions -XX:+UseShenandoahGC 
GC的强项:低延迟时间。
12.ZGC
ZGC与shenandoah目标高度相似,在尽可能对吞吐量影响不大的前提下,实现在任意堆内存大小下都可以把垃圾收集的停颇时间限制在十毫秒以内的低延迟。《深入理解Java虚拟机》一书中这样定义ZGC:ZGC收集器是一款基于Region内存布局的,(暂时)不设分代的,使用了读屏障、染色指针和内存多重映射等技术来实现可并发的标记-压缩算法的,以低延迟为首要目标的一款垃圾收集器。
目前还在试验状态,没有完成所有特性,但此时性能已经相当亮眼,用“令人震惊、革命性”来形容,不为过。未来将在服务端、大内存、低延迟应用的首选垃圾收集器。
JDK14之前,ZGC仅Linux才支持。
三大特性:a. 暂停时间不会超过 10 ms b. 最大支持 16TB 的大堆,最小支持 8MB 的小堆 c. 跟 G1 相比,对应用程序吞吐量的影响小于 15 %。
染色指针
  从前,如果我们要在对象上存储一些额外的、只供收集器或者虚拟机本身使用的数据,通常会在对象头中增加额外的存储字段,如对象的哈希码、分代年龄、锁记录等就是这样存储的。但是如果对象存在被移动过的可能性,即不能保证对象访问能够成功呢?又或者有一些根本就不会去访问对象,但又希望得知该对象的某些信息的应用场景呢?能不能从指针或者与对象内存无关的地方得到这些信息,譬如是否能够看出来对象被移动过?
  所以ZGC使用了染色指针技术,染色指针是一种直接将少量额外的信息存储在指针上的技术,详细点说:
  
  在64位系统中,如果没有被压缩的话,一个指向对象的指针(即地址值)是占64bit的, 虽然高18位不能用来寻址,但剩余的46位指针所能支持的64TB内存在今天仍然能够充分满足大型服务器的需要,鉴于此,ZGC的染色指针技术继续盯上了这剩下的46位指针宽度,将其高4位提取出来存储四个标志信息。通过这些标志位,虚拟机可以直接从指针中看到其引用对象的三色标记状态(Marked0、Marked1)、是否进入了重分配集(即被移动过、Remapped)、是否只能通过finalize()方法才能被访问到(Finalizable),标志位进一步压缩了原本就只有46位的地址空间,也直接导致ZGC能够管理的内存不可以超过4TB(2的42次幂)。
  如果这个指针原来指向了一个对象,在并发标记的过程之中,指向的对象有所改变,我们就用这4个bit来记录下这个变化,下一次重新扫描的时候,就扫描这些变化过的对象(因为是地址值,而且是约定的值,比如规定第一位0是已经变化过的,那么下次直接扫描第一位是0的就好了),只不过这样的话,zgc只能支持4tb的内存.但是如果将来前18位也可以被开发出来使用的话,这4个bit直接挪到前面,那么zgc的支持内存立刻就得以扩展。
读屏障
一小段在最佳位置由JIT注入的代码,从堆中加载一个对象引用时,检查这个引用是否是bad color,如果是,则自愈(对象被转移,自动修正指针)。
  
(1)如果指针指向已经被转移的对象,那么读屏障将修正该指针;
(2)在标记阶段,如果该指针未被标记,那么读屏障将标记该指针;
(3)在转移阶段,如果该指针指向需要转移的区域,那么该指针指向的对象将被转移,然后修正该指针。
读屏障能够确保在 GC 线程与 Java 线程并发运行的情况下,每次指针载入都能访问到正确的对象。
多重映射
ZGC中管理物理内存的基本单位是segment。segment默认与small page size一样,都是2MB。引入segment是为了避免频繁的申请和释放内存的系统调用,一次申请2MB,当segment空闲时,将加入空闲列表,等待之后重复使用。
ZGC为了能高效、灵活地管理内存,实现了两级内存管理:虚拟内存和物理内存,并且实现了物理内存和虚拟内存的映射关系。这和操作系统中虚拟地址和物理地址设计思路基本一致。
  
当应用程序创建对象时,首先在堆空间申请一个虚拟地址,ZGC同时会为该对象在Marked0、Marked1和Remapped三个视图空间分别申请一个虚拟地址,且这三个虚拟地址对应同一个物理地址。
在ZGC中这三个空间在同一时间点有且仅有一个空间有效,ZGC 就是通过这三个视图空间的切换,来完成并发的垃圾回收。
为什么这么设计呢?
这就是ZGC的高明之处,利用虚拟空间换时间。
这三个空间的切换是由垃圾回收的不同阶段触发的,通过限定三个空间在同一时间点有且仅有一个空间有效高效的完成GC过程的并发操作,这个和ZGC并发处理算法有关系。ZGC并发处理算法利用全局空间视图的切换和对象地址视图的切换,结合SATB算法实现了高效的并发。
PS:你在你爸爸妈妈眼中是儿子,在你女朋友眼中是男朋友。在全世界人面前就是最帅的人。你还有一个名字,但名字也只是你的一个代号,并不是你本人。假如你的名字是全世界唯一的,通过“你的名字”、“你爸爸的儿子”、“你女朋友的男朋友”,“世界上最帅的人”最后定位到的都是你本人。
  
ZGC的工作过程
(1)并发标记
  并发标记过程中,GC 线程和 Java 应用线程会并行运行。这个过程需要注意下面几点:
    a. GC 标记线程访问对象时,如果对象地址视图是 Remapped,就把对象地址视图切换到 Marked0,如果对象地址视图已经是 Marked0,说明已经被其他标记线程访问过了,跳过不处理。
    b. 标记过程中Java 应用线程新创建的对象会直接进入 Marked0 视图。
    c. 标记过程中Java 应用线程访问对象时,如果对象的地址视图是 Remapped,就把对象地址视图切换到 Marked0,可以参考前面讲的读屏障。
    d. 标记结束后,如果对象地址视图是 Marked0,那就是活跃的,如果对象地址视图是 Remapped,那就是不活跃的。
  标记阶段的活跃视图也可能是 Marked1,为什么会采用两个视图呢?
  这里采用两个视图是为了区分前一次标记和这一次标记。如果这次标记的视图是 Marked0,那下一次并发标记就会把视图切换到 Marked1。第二次标记的时候,如果还是切换到 Marked0,那么 2 这个对象区分不出是活跃的还是上次标记过的。如果第二次标记切换到 Marked1,就可以区分出了。这时 Marked0 这个视图的对象就是上次标记过程被标记过活跃,转移的时候没有被转移,但这次标记没有被标记为活跃的对象。Marked1 视图的对象是这次标记被标记为活跃的对象。Remapped 视图的对象是上次垃圾回收发生转移或者是被 Java 应用线程访问过,本次垃圾回收中被标记为不活跃的对象。
(2)并发预备重分配
这个阶段需要根据特定的查询条件(算法)统计得出本次收集过程要清理哪些region,把所有不活跃的需要回收的region组成重分配集(Relocation Set)。
(3)并发重分配
将重分配集(Relocation Set)中的region中所有存活的对象,移动到新的region中,并为重分配集中的每个Region维护一个转发表(Forward Table),记录从旧对象到新对象的转向关系。(当用户线程访问对象时,先遇到读屏障,如果是bad color,就回去forword table中找对象新的地址,这个过程就叫做自愈)。
(4)并发重映射
清理需要回收的region,修正整个堆中指向重分配集中旧对象的所有引用,ZGC很巧妙地把并发重映射阶段要做的工作,合并到下一次垃圾收集循环中的并发标记阶段里去完成,反正他们都是要遍历所有对象的,这样合并节省了一次遍历的开销。同时重置对象标识(eg:活对象的指针标识置为remapped)。
ZGC的触发机制
(1)阻塞内存分配请求触发(内存分配时发现堆快满了请求垃圾回收)
(2)分配速率的自适应算法(ZGC自适应的时候设定的空间阈值)
(3)固定时间间隔
(4)主动触发
(5)外部触发
13.AliGC
AliGC是阿里巴巴JVM团队基于G1算法,面向大堆(LargeHeap)应用场景。
14. 低延迟GC Zing
15.如何评估一款GC的性能
- 吞吐量:程序的运行时间(程序的运行时间+内存回收的时间)。
- 垃圾收集开销:吞吐量的补数,垃圾收集器所占时间与总时间的比例。
- 暂停时间:执行垃圾收集时,程序的工作线程被暂停的时间。
- 收集频率:相对于应用程序的执行,收集操作发生的频率。
- 堆空间: Java 堆区所占的内存大小。
- 快速: 一个对象从诞生到被回收所经历的时间。
GC触发条件
1. Minor GC触发条件:Eden区满时2. Full GC触发条件:
(1)调用System.gc时,系统建议执行Full GC,但是不必然执行
(2)老年代空间不足
(3)方法区空间不足
(4)通过Minor GC后进入老年代的平均大小大于老年代的可用内存
(5)由Eden区、From Space区向To Space区复制时,对象大小大于To Space可用内存,则把该对象转存到老年代,且老年代的可用内存小于该对象大小。
 
                     
                    
                 
                    
                

 
                
            
         
         浙公网安备 33010602011771号
浙公网安备 33010602011771号