调查一次内存泄漏
调查分析现场的一次内存泄漏
首先先了解jvm 内存模型划分
《深入理解Java虚拟机(第2版)》中的描述是下面这个样子的:

JVM的内存结构大概分为:
- 堆(Heap):线程共享。所有的对象实例以及数组都要在堆上分配。回收器主要管理的对象。
- 方法区(Method Area):线程共享。存储类信息、常量、静态变量、即时编译器编译后的代码。
- 方法栈(JVM Stack):线程私有。存储局部变量表、操作栈、动态链接、方法出口,对象指针。
- 本地方法栈(Native Method Stack):线程私有。为虚拟机使用到的Native 方法服务。如Java使用c或者c++编写的接口服务时,代码在此区运行。
- 程序计数器(Program Counter Register):线程私有。有些文章也翻译成PC寄存器(PC Register),同一个东西。它可以看作是当前线程所执行的字节码的行号指示器。指向下一条要执行的指令。
先看一张图,这张图能很清晰的说明JVM内存结构的布局和相应的控制参数:

(图片来源于网络)
堆
堆的作用是存放对象实例和数组。从结构上来分,可以分为新生代和老年代。而新生代又可以分为Eden 空间、From Survivor 空间(s0)、To Survivor 空间(s1)。 所有新生成的对象首先都是放在新生代的。需要注意,Survivor的两个区是对称的,没先后关系,所以同一个区中可能同时存在从Eden复制过来的对象,和从前一个Survivor复制过来的对象,而复制到老年代的只有从第一个Survivor区过来的对象。而且,Survivor区总有一个是空的。
- 控制参数:-Xms设置堆的最小空间大小 -Xmx设置堆的最大空间大小。-XX:NewSize设置新生代最小空间大小。-XX:MaxNewSize设置新生代最小空间大小。
- 垃圾回收:此区域是垃圾回收的主要操作区域。
- 异常情况:如果在堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出OutOfMemoryError 异常
方法区
方法区(Method Area)与Java 堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。虽然Java 虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做Non-Heap(非堆),目的应该是与Java 堆区分开来。
很多人愿意把方法区称为“永久代”(Permanent Generation),本质上两者并不等价,仅仅是因为HotSpot虚拟机的设计团队选择把GC 分代收集扩展至方法区,或者说使用永久代来实现方法区而已。对于其他虚拟机(如BEA JRockit、IBM J9 等)来说是不存在永久代的概念的。在Java8中永生代彻底消失了。
- 控制参数: -XX:PermSize 设置最小空间 -XX:MaxPermSize 设置最大空间。
- 垃圾回收:对此区域会涉及但是很少进行垃圾回收。这个区域的内存回收目标主要是针对常量池的回收和对类型的卸载,一般来说这个区域的回收“成绩”比较难以令人满意。
- 异常情况:根据Java 虚拟机规范的规定, 当方法区无法满足内存分配需求时,将抛出OutOfMemoryError。
方法栈
每个线程会有一个私有的栈。每个线程中方法的调用又会在本栈中创建一个栈帧。在方法栈中会存放编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(reference 类型,它不等同于对象本身。局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小。
- 控制参数:-Xss控制每个线程栈的大小。
- 异常情况:在Java 虚拟机规范中,对这个区域规定了两种异常状况:
- StackOverflowError: 异常线程请求的栈深度大于虚拟机所允许的深度时抛出;
- OutOfMemoryError 异常: 虚拟机栈可以动态扩展,当扩展时无法申请到足够的内存时会抛出。
本地方法栈
本地方法栈(Native Method Stacks)与虚拟机栈所发挥的作用是非常相似的,其
区别不过是虚拟机栈为虚拟机执行Java 方法(也就是字节码)服务,而本地方法栈则
是为虚拟机使用到的Native 方法服务。
- 控制参数:在Sun JDK中本地方法栈和方法栈是同一个,因此也可以用-Xss控制每个线程的大小。
- 异常情况:与虚拟机栈一样,本地方法栈区域也会抛出StackOverflowError 和OutOfMemoryError
异常。
程序计数器
它的作用可以看做是当前线程所执行的字节码的行号指示器。
- 异常情况:此内存区域是唯一一个在Java 虚拟机规范中没有规定任何OutOfMemoryError 情况的区域。
常见内存溢出错误
有了对内存结构清晰的认识,就可以帮助我们理解不同的OutOfMemoryErrors,下面列举一些比较常见的内存溢出错误,通过查看冒号“:”后面的提示信息,基本上就能断定是JVM运行时数据的哪个区域出现了问题。
Exception in thread “main”: java.lang.OutOfMemoryError: Java heap space
原因:对象不能被分配到堆内存中。
Exception in thread “main”: java.lang.OutOfMemoryError: PermGen space
原因:类或者方法不能被加载到老年代。它可能出现在一个程序加载很多类的时候,比如引用了很多第三方的库。
Exception in thread “main”: java.lang.OutOfMemoryError: Requested array size exceeds VM limit
原因:创建的数组大于堆内存的空间。
Exception in thread “main”: java.lang.OutOfMemoryError: request <size> bytes for <reason>. Out of swap space?
原因:分配本地分配失败。JNI、本地库或者Java虚拟机都会从本地堆中分配内存空间。
Exception in thread “main”: java.lang.OutOfMemoryError: <reason> <stack trace>(Native method)
原因:同样是本地方法内存分配失败,只不过是JNI或者本地方法或者Java虚拟机发现。
现场问题分析
言归正传,回到主题,现场在部署应用之后,在运行过程中突然出现OOM,java.lang.OutOfMemoryError: GC overhead limit exceeded
超出了GC开销限制。科普了一下,这个是JDK6新添的错误类型。是发生在GC占用大量时间为释放很小空间的时候发生的,是一种保护机制。一般是因为堆太小,导致异常的原因:没有足够的内存。
Sun 官方对此的定义:超过98%的时间用来做GC并且回收了不到2%的堆内存时会抛出此异常。那为什么都发生gc了,还有难以释放的内存呢?
需要现场获取dump文件在eclipse memory analyzer上继续进行分析
jmap -dump:format=b,file=/home/admin/logs/heap.hprof 进程
当然也可以加上如下jvm参数,可以在发生oom时自动生成dump文件
-XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/home/jvmlogs/
经过现场发来的dump文件发现,eclipse memory analyzer自动帮我们发现了可疑的泄漏点(我的方式,thread_overview->JAVA Basics->dominator tree)

thread-pool-35 keeps local variables with total size 1,216,555,792 (88.31%) bytes.
thread-pool-35线程 这个char[]对象占据了总大小的88.31%,总共是

1,216,555,792字节,换算成mb就是1160mb
查看details和查看其线程栈发现
经过分析,原因是在页面点击文件上传时,由于Mybatis 批量插入了庞大的数据量,导致内存使用增加,才会出现这个问题引发的内存溢出
参考网上的一案例
由于①mybatis的DAO接口我是传List,而mybatis的foreach底层代码是arrays的,②所以需要把List转arrays,然后遍历Arrays,③用StringBuilder拼接SQL的。
问题出现在②③步!因生成的arrays对象和StringBuilder对象是在堆内存中的,而堆内存的对象GC回收机制是:只有JVM的使用内存达到最大内存时的一定阀值,才会执行GC回收!
如果当本身JVM已经使用了占有了JVM的最大内存的90%,那么②③步的生成的对象占有内存+本身已占有的内存如果超出JVM的最大内存,而JVM又来不及执行GC时就会导致JVM内存溢出,当前线程挂掉!
解决办法:
1,提醒应用方优化代码,从根本解决问题。(重要)
2,JVM给出这样一个参数:-XX:-UseGCOverheadLimit 禁用这个检查,其实这个参数解决不了内存问题,只是把错误的信息延后,替换成 java.lang.OutOfMemoryError: Java heap space。
3,增大堆内存 -Xms -Xmx -XX:MaxNewSize -XX:MaxPermSize
学习链接
MAT常见泄漏Problem Suspect解析方案
https://blog.csdn.net/cui130/article/details/89916495
Mybatis 批量插入引发的血案
https://blog.csdn.net/bobozai86/article/details/84560641
https://blog.csdn.net/syy_c_j/article/details/52151402
问题分析2:
现场一个应用,部署后一直卡着,卡非常久之后发生了oom,分析dump文件发现,在加载lib下的jar包时发生了死循环





浙公网安备 33010602011771号