初步认识JVM

JVM探究

  • 请你谈谈对JVM的理解?java8虚拟机和之前的相比有什么新特性?
  • 什么是OOM,什么是栈溢出StackOverFlowError?怎么分析?
  • JVM的调优参数有哪些?
  • 内存快照如何抓取,怎么分析Dump文件?
  • 谈谈JVM中,类加载器你的认识?

1. JVM的位置

​ 在操作系统上

2.JVM的体系结构

image-20210820112925038

3.类加载器

​ 作用:加载class文件

image-20210820151456422

虚拟机自带的加载器

  1. 启动类(根)加载器
  2. 扩展类加载器
  3. 应用程序(系统类)加载器

4.双亲委派机制

​ 类加载器收到类加载的请求,将这个请求委托给当前类加载器的父类,直到根加载器,根加载器检查是否可以加载当前这个类,能加载就结束,使用当前的根加载器,不能加载就通知子加载器加载,向上请求,向下加载

img

img

5.沙箱安全机制

​ 什么是沙箱?

Java安全模型的核心就是Java沙箱(sandbox),什么是沙箱?沙箱是一个限制程序运行的环境。沙箱机制就是将 Java 代码限定在虚拟机(JVM)特定的运行范围中,并且严格限制代码对本地系统资源访问,通过这样的措施来保证对代码的有效隔离,防止对本地系统造成破坏。沙箱主要限制系统资源访问,那系统资源包括什么?——CPU、内存、文件系统、网络。不同级别的沙箱对这些资源访问的限制也可以不一样。

所有的Java程序运行都可以指定沙箱,可以定制安全策略。

java中的安全模型:

在Java中将执行程序分成本地代码和远程代码两种,本地代码默认视为可信任的,而远程代码则被看作是不受信的。对于授信的本地代码,可以访问一切本地资源。而对于非授信的远程代码在早期的Java实现中,安全依赖于沙箱 (Sandbox) 机制。如下图所示 JDK1.0安全模型
在这里插入图片描述

但如此严格的安全机制也给程序的功能扩展带来障碍,比如当用户希望远程代码访问本地系统的文件时候,就无法实现。因此在后续的 Java1.1 版本中,针对安全机制做了改进,增加了安全策略,允许用户指定代码对本地资源的访问权限。如下图所示 JDK1.1安全模型
在这里插入图片描述

在 Java1.2 版本中,再次改进了安全机制,增加了代码签名。不论本地代码或是远程代码,都会按照用户的安全策略设定,由类加载器加载到虚拟机中权限不同的运行空间,来实现差异化的代码执行权限控制。如下图所示 JDK1.2安全模型
在这里插入图片描述

当前最新的安全机制实现,则引入了域 (Domain) 的概念。虚拟机会把所有代码加载到不同的系统域和应用域,系统域部分专门负责与关键资源进行交互,而各个应用域部分则通过系统域的部分代理来对各种需要的资源进行访问。虚拟机中不同的受保护域 (Protected Domain),对应不一样的权限 (Permission)。存在于不同域中的类文件就具有了当前域的全部权限,如下图所示 最新的安全模型(jdk 1.6)
在这里插入图片描述

以上提到的都是基本的Java 安全模型概念,在应用开发中还有一些关于安全的复杂用法,其中最常用到的 API 就是 doPrivileged。doPrivileged 方法能够使一段受信任代码获得更大的权限,甚至比调用它的应用程序还要多,可做到临时访问更多的资源。有时候这是非常必要的,可以应付一些特殊的应用场景。例如,应用程序可能无法直接访问某些系统资源,但这样的应用程序必须得到这些资源才能够完成功能。

组成沙箱的基本组件:

  • 字节码校验器(bytecode verifier):确保Java类文件遵循Java语言规范。这样可以帮助Java程序实现内存保护。但并不是所有的类文件都会经过字节码校验,比如核心类。

  • 类装载器
    

    (class loader):其中类装载器在3个方面对Java沙箱起作用

    • 它防止恶意代码去干涉善意的代码;
    • 它守护了被信任的类库边界;
    • 它将代码归入保护域,确定了代码可以进行哪些操作。

虚拟机为不同的类加载器载入的类提供不同的命名空间,命名空间由一系列唯一的名称组成,每一个被装载的类将有一个名字,这个命名空间是由Java虚拟机为每一个类装载器维护的,它们互相之间甚至不可见。

类装载器采用的机制是双亲委派模式。

  1. 从最内层JVM自带类加载器开始加载,外层恶意同名类得不到加载从而无法使用;
  2. 由于严格通过包来区分了访问域,外层恶意的类通过内置代码也无法获得权限访问到内层类,破坏代码就自然无法生效。
  • 存取控制器(access controller):存取控制器可以控制核心API对操作系统的存取权限,而这个控制的策略设定,可以由用户指定。

  • 安全管理器(security manager):是核心API和操作系统之间的主要接口。实现权限控制,比存取控制器优先级高。

  • 安全软件包
    

    (security package):java.security下的类和扩展包下的类,允许用户为自己的应用增加新的安全特性,包括:

    • 安全提供者
    • 消息摘要
    • 数字签名
    • 加密
    • 鉴别

6.Native

什么是native

 -  凡是带了native关键字的,说明java的作用范围达不到了,回去调用底层c语言的库
 -  会进入本地方法栈
 -  调用本地方法接口  JNI
 -  JNI作用:扩展java的使用,融合不同的编程语言为java所用
 -  java诞生的时候,C、C++横行,想要立足,必须要有调用C、C++的程序
 -  它在内存中专门开辟了一块标记区域: Native Method Stack,登记native方法,在(Execution Engine)执行引擎执行的时候加载Native Libraies【本地库】
 -  在最终执行的时候,加载本地方法库中的方法通过JNI

7.PC寄存器

程序计数器:Program Counter Register

​ 每个线程都有一个程序计数器,是程序私有的,就是一个指针,指向方法区中的方法字节码(用来存储指向一条指 令的地址,也就是即将要执行的指令代码),是一个非常小的内存空间,几乎可以忽略不计。

8.方法区

Method Asia 方法区:逻辑上的东西,是JVM 的规范,所有虚拟机必须遵守的。

​ 方法区是被所有线程共享,所有字段和方法字节码,以及一些特殊方法,如构造函数,接口代码也在此定义,

简单说,所有定义的方法的信息都保存在该区域,此区域属于共享区间;

静态常量、常量、类信息(构造方法,接口定义)、运行时的常量池存在方法区中,但是,实例变量存

在堆内存中,和方法区无关

static,final,Class,常量池

9.栈

栈:数据结构

程序 = 数据结构 + 算法

栈:先进后出,都在栈顶操作,桶

队列:先进先出(FIFO:First Input First Output),从上边进下边出,管道

(吃了吐的是栈,吃了拉的是队列)

为什么main()方法先执行,最后结束~

​ main()方法执行后先入栈,最后出栈

栈:栈内存,主管线程的运行,生命周期和线程同步;

线程结束,栈内存也就释放,不存在垃圾回收问题,一旦线程结束,栈就Over

栈:8大基本数据类型 + 对象引用(参数) + 实例的方法

栈运行原理: 栈帧

image-20210821093415370

9.三种JVM

  • Sun公司 HotSpot Java HotSpot(TM) 64-Bit Server VM (build 15.0.2+7-27, mixed mode, sharing)

  • BEA JRockit

  • IBM J9 VM

10.堆

Heap,一个JVM虚拟机只能有一个堆内存,堆内存的大小是可以调节的。

类加载器读取了类文件后,一般会把什么东西放在堆中? new出来的对象

字符串常量池在堆中,运行时常量池在元空间中

GC垃圾回收

​ 假设内存满了,OOM,堆内存不够,java.lang.OutOfMemoryError: Java heap space

在JDK8之后,永久存储区改了个名字(元空间):

11.新生代,老年代

java堆细分为新生代和老年代,无论如何划分,都与存放内容无关,无论哪个区域,存储的都仍是对象实例 ,进一步划分的目的是为了更好的回收内存,或者更快地分配内存

12.永久代(元空间)

Jdk8以后开始把类的元数据放在本地堆内存中,这一块区域就叫做Metaspace,该区域在jdk7及以前是属于永久带的,元空间和永久代都是用来存储class相关信息,包括class对象的Method,Field等,元空间和永久代其实都是方法区的实现,只是实现有所不同,所以说方法区其实只是一种JVM的规范。

元空间与永久代区别是其内存空间直接使用的是本地内存,而metaspace没有了字符串常量池,而在jdk7的时候已经被移动到了堆中,MetaSpace其他存储的东西,包括类文件,在JAVA虚拟机运行时的数据结构,以及class相关的内容,如Method,Field道理上都与永久代一样,只是划分上更趋于合理,比如说类及相关的元数据的生命周期与类加载器一致,每个加载器就是我们常说的classloader,都会分配一个单独的存储空间。

  • jdk1.6之前:永久代,常量池在方法区;
  • jdk1.7 :永久代,但是慢慢退化了,常量池在堆中
  • jdk1.8之后:无永久代,常量池(运行时常量池和静态常量池)在元空间,字符串常量池在堆中

方法区在非堆中,非堆也是堆,

在一个项目中,突然出现了OOM(Out Of Memory)故障,那么该如何排除~研究为什么出错

  • 能够看到代码第几行出错:内存快照分析工具,MAT,Jprofiler
  • Debug 一行行分析代码

13.堆内存调优

14.GC:垃圾回收

image-20210822140747294

JVM在进行GC时,并不是对三个区域统一回收,大部分时候都是在新生代

  • 新生代
  • 幸存区(from ,to)
  • 老年代

GC两种类型:轻GC(普通GC)(minor gc), 重GC(全局GC)(full gc)

GC题目:

  • JVM的内存模型和分区,详细到每个区放什么?
  • 堆里的分区有哪些?Eden,from,to,老年区,说说他们的特点
  • GC的算法有哪些?复制算法,标记整理算法,标记清除算法,引用计数法
  • 轻GC 和 重GC分别在什么时候发生?

image-20210822143339721

复制算法:

*设置两个Survivor区最大的好处就是解决了碎片化*

触发Minor GC,Eden区和幸存from区的存活对象会被复制到to区,Eden区和from区被清空,from区变为to区

建立两块Survivor区,刚刚新建的对象在Eden中,经历一次Minor GC,Eden中的存活对象就会被移动到第一块survivor space S0,Eden被清空;等Eden区再满了,就再触发一次Minor GC,Eden和S0中的存活对象又会被复制送入第二块survivor space S1(这个过程非常重要,因为这种复制算法保证了S1中来自S0和Eden两部分的存活对象占用连续的内存空间,避免了碎片化的发生)。S0和Eden被清空,然后下一轮S0与S1交换角色,如此循环往复。

  • 好处:没有内存的碎片
  • 坏处:浪费了内存空间:多了一半空间永远为空的to区

复制算法最佳使用场景:对象存活度较低的时候:新生区~

含义 参数
堆初始容量 -Xms
堆最大容量 -Xmx或-XX:MaxHeapSize=size
新生代容量 -Xmn或者-XX:NewSize=szie 和-XX:MaxNewSize=size
幸存区比例(动态) -XX:InitialSurvivorRatio=ratio和-XX:UseAdaptiveSizePolicy
幸存区比例 -XX:SurvivorRatio=ratio
晋升阙值 -XX:MaxTenuringThreshold=threshold
晋升详情 -XX:+PrintTenuringDistribution
GC详情 -XX:+PrintGCDetails -verbose:gc
Full GC前Minor GC -XX+ScavengeBeforeFullGC

标记清除算法

​ 扫描这些对象,对或者的对象进行标记

​ 清除:对没有标记的对象进行清除

  • 优点:不需要额外的空间
  • 缺点:两次扫描,严重浪费时间,会产生内存碎片

标记整理算法

防止内存碎片产生

总结

内存效率:复制算法 > 标记清除算法 > 标记压缩算法 (时间复杂度)

内存整齐度:复制算法 = 标记压缩 > 标记清除

内存利用率:标记压缩 = 标记清除 > 复制算法

没有最优的算法,只有最合适的算法(分代收集算法)

年轻代

  • 存活率低 用复制算法

老年代

  • 区域大:存活率高
  • 标记清除(内存碎片不是很多)+标记压缩混合实现

15.JMM

1.什么是JMM?

​ JMM java内存模型(Java Memory Model)

2.它是干嘛的?

​ 作用:缓存一致性协议,用于定义数据读写的规则

​ JMM定义了线程工作内存和主内存之间的抽象关系:线程之间的共享变量存储在主内存中,每个线程都有一个私有的本地内存

image-20210822172004510

解决共享对象可见性问题:voliate

3.它该如何学习?

内存交互操作

 内存交互操作有8种,虚拟机实现必须保证每一个操作都是原子的,不可在分的(对于double和long类型的变量来说,load、store、read和write操作在某些平台上允许例外)

  • lock (锁定):作用于主内存的变量,把一个变量标识为线程独占状态

  • unlock (解锁):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定

  • read (读取):作用于主内存变量,它把一个变量的值从主内存传输到线程的工作内存中,以便随后的load动作使用

  • load (载入):作用于工作内存的变量,它把read操作从主存中变量放入工作内存中

  • use (使用):作用于工作内存中的变量,它把工作内存中的变量传输给执行引擎,每当虚拟机遇到一个需要使用到变量的值,就会使用到这个指令

  • assign (赋值):作用于工作内存中的变量,它把一个从执行引擎中接受到的值放入工作内存的变量副本中

  • store (存储):作用于主内存中的变量,它把一个从工作内存中一个变量的值传送到主内存中,以便后续的write使用

  • write  (写入):作用于主内存中的变量,它把store操作从工作内存中得到的变量的值放入主内存的变量中

  JMM对这八种指令的使用,制定了如下规则:

    • 不允许read和load、store和write操作之一单独出现。即使用了read必须load,使用了store必须write
    • 不允许线程丢弃他最近的assign操作,即工作变量的数据改变了之后,必须告知主存
    • 不允许一个线程将没有assign的数据从工作内存同步回主内存
    • 一个新的变量必须在主内存中诞生,不允许工作内存直接使用一个未被初始化的变量。就是怼变量实施use、store操作之前,必须经过assign和load操作
    • 一个变量同一时间只有一个线程能对其进行lock。多次lock后,必须执行相同次数的unlock才能解锁
    • 如果对一个变量进行lock操作,会清空所有工作内存中此变量的值,在执行引擎使用这个变量前,必须重新load或assign操作初始化变量的值
    • 如果一个变量没有被lock,就不能对其进行unlock操作。也不能unlock一个被其他线程锁住的变量
    • 对一个变量进行unlock操作之前,必须把此变量同步回主内存

  JMM对这八种操作规则和对volatile的一些特殊规则就能确定哪里操作是线程安全,哪些操作是线程不安全的了。但是这些规则实在复杂,很难在实践中直接分析。所以一般我们也不会通过上述规则进行分析。更多的时候,使用java的happen-before规则来进行分析。

posted @ 2021-08-22 17:43  kokurachiyo  阅读(326)  评论(0)    收藏  举报