JVM垃圾回收器理论分析与详解【纯理论】

继续上次【https://www.cnblogs.com/webor2006/p/10740084.html】的理论继续。。有点吐血的感觉，都不知道学了这么一大堆理论有何实际意义，本身JVM就是个理论体系比较多的东东，所以理论不得不去面对，继续硬着头皮往前进。

内存结构

这个在之前的学习中都已经学习过了，复习一下。

内存分配

堆上分配
大多数情况在eden【年轻代中的一个区域】上分配，偶尔会直接在old【老年代】上分配，细节取决于GC的实现。
栈上分配
原子类型的局部变量。

内存回收

1、GC要做的是将那些dead的对象所占用的内存回收掉。

Hotspot认为没有引用的对象是dead的。
Hotspot将引用分为四种：Strong【强引用】、Soft【软引用】、Weak【弱引用】、Phantom【虚引用】，这是大伙熟知的。
1、Strong既默认通过Object o = new Object()这种方式赋值的引用。
2、Soft、Weak、Phantom这三种则是继续Reference。

2、在Full GC时会对Reference类型的引用进行特殊处理。

Soft：内存不够时一定会被GC、长期不用也会被GC。
Weak：一定会被GC，当被mark为dead，会在ReferenceQueue中通知。
Phantom：本来就没引用，当从jvm heap中释放时会通知。

以上的概念会在未来举例进行代码说明的，先有个印象。

垃圾收集算法

以上是一些比较经典的垃圾收集算法，下面会逐个进行说明。

GC的时机

1、在分代模型的基础上，GC从时机上分为两种：Scavenge GC和Full GC。

2、Scavenge GC（Minor GC）

触发时机：新对象生成时，Eden空间满了。
理论上Eden区大多数对象会在Scavenge GC回收，复制算法的执行效率会很高，Scavenge GC时间比较短。

3、Full GC【这个在实际中一定得要避免】

对整个JVM进行整理，包括Young、Old和Perm。
主要的触发时机：1）Old满了；2）Perm满了；3）system.gc()
效率很低，尽量减少Full GC。

垃圾回收器(Garbage Collector)

分代模型：GC的宏观愿景。
垃圾回收器：GC的具体实现。
Hotspot JVM提供多种垃圾回收器，我们需要根据具体应用的需要采用不同的回收器。
没有万能的垃圾回收器，每种垃圾回收器都有自己的适用场景。

垃圾收集器的“并行”和“并发”

并行（Parallel）:指多个收集器的线程同时工作，但是用户线程处于等待状态。
并发（Concurrent）:指收集器在工作时同时，可以允许用户线程工作。
并发不代表解决了GC停顿的问题，在关键的步骤还是要停顿。比如在收集器标记垃圾的时候。但在清除垃圾的时候，用户线程可以和GC线程并发执行。

Serial收集器

单线程收集器，收集时会暂停所有工作线程（Stop The World，简单STW），使用复制收集算法，虚拟机运行在Client模式时的默认新生代会采用此收集器。
最早的收集器，单线程进行GC。
New和Old Generation都可以使用。
在新生代，采用复制算法：在老年代，采用Mark-Compact算法。
因为是单线程GC，没有多线程切换的额外开销，简单实用。
Hotspot Client模式缺省的的收集器

如图中出现了一个词：“Safepoint”，安全点，在之后会举具体的实例来说明安全点的作用。

ParNew收集器

ParNew收集器就是Serial的多线程版本，除了使用多个收集线程外，其余行为包括算法、STW、对象分配规则、回收策略等都与Serial收集器一模一样。
对应的这种收集器是虚拟机运行在Server模式的默认新生代收集器，在单CPU的环境中，ParNew收集器并不会比Serial收集器有更好的效果。
Serial收集器在新生代的多线程版本。
使用复制算法（因为针对新生代）。
只有在多CPU的环境下，效率才会比Serial收集器高。
可以通过-XX:ParallelGCThreads来控制GC线程数的多少。需要结合具体CPU的个数。
Server模式下新生代的缺省收集器。

Parallel Scavenge收集器

Parallel Scavenge收集器也是一个多线程收集器，也是使用复制算法，但它的对象分配规则与回收策略都与ParNew收集器有所不同，它是以吞吐量最大化（既GC时间占总运行时间最小）为目标的收集器实现，它允许较长时间的STW换取总吞吐量最大化。

Serial Old收集器

Serial Old是单线程收集器，使用标记-整理算法，是老年代的收集器。

Parallel Old收集器

老年代版本吞吐量优先收集器，使用多线程和标记一整理算法，JVM1.6提供，在此之前，新生代使用了PS收集器的话，老年代除Serial Old外别无选择，因为PS无法与CMS收集器配合工作。【了解既可】
Parallel Scavenge在老年代的实现
在JVM1.6才出现Parallel Old
采用多线程，Mark-Compact算法
更注重吞吐量
Parallel Scavenge + Parallel Old = 高吞吐量，但GC停顿可能不理想

CMS(Concurrent Mark Sweep)收集器【特别复杂的一种收集器】

CMS是一种以最短停顿时间为目标的收集器，使用CMS并不能达到GC效率最高（总体GC时间最小），但它能尽可能降低GC时服务的停顿时间，CMS收集器使用的是标记-清除算法。
追求最短停顿时间，非常适合Web应用。
只针对老年区，一般结合ParNew使用。
Concurrent，GC线程和用户线程并发工作（尽量并发）。
Mark-Sweep。
只有在多CPU环境下才有意义。
使用-XX:+UseConcMarkSweepGC打开。
CMS以牺牲CPU资源的代价来减少用户线程的停顿。当CPU个数少于4的时候，有可能对吞吐量影响非常大。
CMS在并发清理的过程中，用户线程还在跑。这时候需要预留一部分空间给用户线程。
CMS用Mark-Sweep，会带来碎片问题。碎片过多的时候会容易频繁触发Full GC。

GC垃圾收集器的JVM参数定义

Java内存泄漏的经典原因

1、对象定义在错误的范围（Wrong Scope）。

如果Foo实例对象的生命较长，会导致临时性内存泄漏。（这里的names变量其实只是临时作用）
JVM喜欢生命周期短的对象，这样做已经足够高效【调整】

这样一改之后，只要是doIt()方法一结束names的临时变量就立马会被回收。

2、异常（Exception）处理不当。

错误的做法

对于有经验的程序员应该不会出现上面的问题，但是这里只是抛出泄漏的场景。
正确的做法

3、集合数据管理不当。

当使用Array-based的数据结构（ArrayList，HashMap等）时，尽量减少resize：
a、比如new ArrayList时，尽量估算size，在创建的时候把size确定。
b、减少resize可以避免没有必要的array copying，gc碎片等问题。
如果一个List只需要顺序访问，不需要随机访问（Random Access）,用LinkedList代替ArrayList
a、LInkedList本质是链表，不需要resize，但只适用于顺序访问。

以上是对JVM垃圾回收相关理论的整体了解，说实话看完其实头晕晕的，没关系，接下来则会用实践来反证理论。

posted on 2019-06-05 22:50 cexo 阅读(1339) 评论(0) 收藏举报

刷新页面返回顶部

cexo

JVM垃圾回收器理论分析与详解【纯理论】

导航

公告