JVM垃圾回收器理论分析与详解【纯理论】

继续上次【https://www.cnblogs.com/webor2006/p/10740084.html】的理论继续。。有点吐血的感觉,都不知道学了这么一大堆理论有何实际意义,本身JVM就是个理论体系比较多的东东,所以理论不得不去面对,继续硬着头皮往前进。

内存结构

这个在之前的学习中都已经学习过了,复习一下。

内存分配

  • 堆上分配
    大多数情况在eden【年轻代中的一个区域】上分配,偶尔会直接在old【老年代】上分配,细节取决于GC的实现。
  • 栈上分配
    原子类型的局部变量。

内存回收

1、GC要做的是将那些dead的对象所占用的内存回收掉。

  • Hotspot认为没有引用的对象是dead的。
  • Hotspot将引用分为四种:Strong【强引用】、Soft【软引用】、Weak【弱引用】、Phantom【虚引用】,这是大伙熟知的。
    1、Strong既默认通过Object o = new Object()这种方式赋值的引用。
    2、Soft、Weak、Phantom这三种则是继续Reference。

2、在Full GC时会对Reference类型的引用进行特殊处理。

  • Soft:内存不够时一定会被GC、长期不用也会被GC。
  • Weak:一定会被GC,当被mark为dead,会在ReferenceQueue中通知。
  • Phantom:本来就没引用,当从jvm heap中释放时会通知。

以上的概念会在未来举例进行代码说明的,先有个印象。

垃圾收集算法

以上是一些比较经典的垃圾收集算法,下面会逐个进行说明。

GC的时机

1、在分代模型的基础上,GC从时机上分为两种:Scavenge GC和Full GC。

2、Scavenge GC(Minor GC)

  • 触发时机:新对象生成时,Eden空间满了。
  • 理论上Eden区大多数对象会在Scavenge GC回收,复制算法的执行效率会很高,Scavenge GC时间比较短。

3、Full GC【这个在实际中一定得要避免】

  • 对整个JVM进行整理,包括Young、Old和Perm。
  • 主要的触发时机:1)Old满了;2)Perm满了;3)system.gc()
  • 效率很低,尽量减少Full GC

垃圾回收器(Garbage Collector)

  • 分代模型:GC的宏观愿景。
  • 垃圾回收器:GC的具体实现。
  • Hotspot JVM提供多种垃圾回收器,我们需要根据具体应用的需要采用不同的回收器。
  • 没有万能的垃圾回收器,每种垃圾回收器都有自己的适用场景。

垃圾收集器的“并行”和“并发”

  • 并行(Parallel):指多个收集器的线程同时工作,但是用户线程处于等待状态。
  • 并发(Concurrent):指收集器在工作时同时,可以允许用户线程工作。
    并发不代表解决了GC停顿的问题,在关键的步骤还是要停顿。比如在收集器标记垃圾的时候。但在清除垃圾的时候,用户线程可以和GC线程并发执行。 

Serial收集器

  • 单线程收集器,收集时会暂停所有工作线程(Stop The World,简单STW),使用复制收集算法,虚拟机运行在Client模式时的默认新生代会采用此收集器。
  • 最早的收集器,单线程进行GC。
  • New和Old Generation都可以使用。
  • 在新生代,采用复制算法:在老年代,采用Mark-Compact算法。
  • 因为是单线程GC,没有多线程切换的额外开销,简单实用。
  • Hotspot Client模式缺省的的收集器

    如图中出现了一个词:“Safepoint”,安全点,在之后会举具体的实例来说明安全点的作用。

ParNew收集器

  • ParNew收集器就是Serial的多线程版本,除了使用多个收集线程外,其余行为包括算法、STW、对象分配规则、回收策略等都与Serial收集器一模一样。
  • 对应的这种收集器是虚拟机运行在Server模式的默认新生代收集器,在单CPU的环境中,ParNew收集器并不会比Serial收集器有更好的效果。
  • Serial收集器在新生代的多线程版本。
  • 使用复制算法(因为针对新生代)。
  • 只有在多CPU的环境下,效率才会比Serial收集器高。
  • 可以通过-XX:ParallelGCThreads来控制GC线程数的多少。需要结合具体CPU的个数。
  • Server模式下新生代的缺省收集器。

Parallel Scavenge收集器

  •  Parallel Scavenge收集器也是一个多线程收集器,也是使用复制算法,但它的对象分配规则与回收策略都与ParNew收集器有所不同,它是以吞吐量最大化(既GC时间占总运行时间最小)为目标的收集器实现,它允许较长时间的STW换取总吞吐量最大化。

Serial Old收集器

  •  Serial Old是单线程收集器,使用标记-整理算法,是老年代的收集器。

Parallel Old收集器

  • 老年代版本吞吐量优先收集器,使用多线程和标记一整理算法,JVM1.6提供,在此之前,新生代使用了PS收集器的话,老年代除Serial Old外别无选择,因为PS无法与CMS收集器配合工作。【了解既可】
  • Parallel Scavenge在老年代的实现
  • 在JVM1.6才出现Parallel Old
  • 采用多线程,Mark-Compact算法
  • 更注重吞吐量
  • Parallel Scavenge + Parallel Old = 高吞吐量,但GC停顿可能不理想

CMS(Concurrent Mark Sweep)收集器【特别复杂的一种收集器】

  • CMS是一种以最短停顿时间为目标的收集器,使用CMS并不能达到GC效率最高(总体GC时间最小),但它能尽可能降低GC时服务的停顿时间,CMS收集器使用的是标记-清除算法。
  • 追求最短停顿时间,非常适合Web应用。
  • 只针对老年区,一般结合ParNew使用。
  • Concurrent,GC线程和用户线程并发工作(尽量并发)。
  • Mark-Sweep。
  • 只有在多CPU环境下才有意义 。
  • 使用-XX:+UseConcMarkSweepGC打开。
  • CMS以牺牲CPU资源的代价来减少用户线程的停顿。当CPU个数少于4的时候,有可能对吞吐量影响非常大。
  • CMS在并发清理的过程中,用户线程还在跑。这时候需要预留一部分空间给用户线程。
  • CMS用Mark-Sweep,会带来碎片问题。碎片过多的时候会容易频繁触发Full GC。

GC垃圾收集器的JVM参数定义

Java内存泄漏的经典原因

1、对象定义在错误的范围(Wrong Scope)。

  • 如果Foo实例对象的生命较长,会导致临时性内存泄漏。(这里的names变量其实只是临时作用)
  • JVM喜欢生命周期短的对象,这样做已经足够高效【调整】

    这样一改之后,只要是doIt()方法一结束names的临时变量就立马会被回收。

2、异常(Exception)处理不当。

  • 错误的做法

    对于有经验的程序员应该不会出现上面的问题,但是这里只是抛出泄漏的场景。
  • 正确的做法

3、集合数据管理不当。

  • 当使用Array-based的数据结构(ArrayList,HashMap等)时,尽量减少resize:
    a、比如new ArrayList时,尽量估算size,在创建的时候把size确定。
    b、减少resize可以避免没有必要的array copying,gc碎片等问题。
  • 如果一个List只需要顺序访问,不需要随机访问(Random Access),用LinkedList代替ArrayList
    a、LInkedList本质是链表,不需要resize,但只适用于顺序访问。

 

以上是对JVM垃圾回收相关理论的整体了解,说实话看完其实头晕晕的,没关系,接下来则会用实践来反证理论。

posted on 2019-06-05 22:50  cexo  阅读(1239)  评论(0编辑  收藏  举报

导航