软引用,Java字节码指令

关于Java的强/软/弱引用,今天总结一下他们的区别和应用。

引用的强弱程度

根据JVM对三种引用的内存回收时机来区分的话，可以把他们按

强引用 > 软引用 > 弱引用

来排列。在JVM运行内存不足时，这三种之中最先被回收的是弱引用，依次到最后才是强引用(不会被回收)。
但是对于强引用来说，JVM在内存不足时宁可抛出 OOM，也不会随意回收强引用来释放内存。
下面具体说下强引用。

强引用 Strong Reference

在最经常实例化对象的语法里，如果不指定引用类型，那么默认是强引用。

Object  Object = new Object();

分两种情况来说明一下。
· 在方法中的强引用
· 全局强引用

方法中的强引用

在方法内声明一个强引用对象的话，在内存中会分两部分来进行。首先引用会保存在Stack中，而引用的对象Object会存放在堆中。

上面的图说明了JVM的内存模型和各种对象存放的位置。
当方法执行完后，会退出方法栈，此时引用不在，所以Object会被回收。

全局强引用

其实在JVM中没有全局变量这种概念，相对的是全局静态变量。我们可以看一个类Global在编译后的字节码，

public class Global {
    Global global = new Global();

    public Global(){

    }

    public static void main(String[] args) {
      System.out.println("global");
    }
}

javap -c Global.Class

public class Global {
  Global global;

  public Global();
    Code:
       0: aload_0
       1: invokespecial #1                  // Method java/lang/Object."<init>":()V
       4: aload_0
       5: new           #2                  // class Global
       8: dup
       9: invokespecial #3                  // Method "<init>":()V
      12: putfield      #4                  // Field global:LGlobal;
      15: return

  public static void main(java.lang.String[]);
    Code:
       0: getstatic     #5                  // Field java/lang/System.out:Ljava/io/PrintStream;
       3: ldc           #6                  // String global
       5: invokevirtual #7                  // Method java/io/PrintStream.println:(Ljava/lang/String;)V
       8: return
}

可以看出来，其实非静态的变量也是在默认构造方法中实例化的，但是静态变量就不同了。静态变量是在堆中存放引用和对象，
所以全局静态引用需要在不使用时将它置为null

object = null;

软引用 SoftReference

软引用在JVM内存不足时会被回收，用这种特性，可以在一些内存敏感的场景上用软引用。
比如Bitmap对象，可以用软引用

SoftReference<Bitmap> bitmap = new SoftReference<Bitmap>();

弱引用 WeakReference

弱引用有着比软引用更脆弱的生命周期。即使内存充足，但是只要被GC扫描到就会被回收

WeakReference<String> abcWeakRef = new WeakReference<String>(str);

前言

随着Java开发技术不断被推到新的高度，对于Java程序员来讲越来越需要具备对更深入的基础性技术的理解，比如Java字节码指令。不然，可能很难深入理解一些时下的新框架、新技术，盲目一味追新也会越来越感乏力。

本文既不求照本宣科，亦不求炫技或著文立说，仅力图以最简明、最形象生动的方式，结合例子与实战，让小白也能搞懂这门看似复杂的技术概念。

单刀直入

闲言碎语不要讲，先表一表，什么是Java字节码指令？简而言之，Java字节码指令就是Java虚拟机能够听得懂、可执行的指令，可以说是Jvm层面的汇编语言，或者说是Java代码的最小执行单元。
有点Java基础的人一定都知道，javac命令会将Java源文件编译成字节码文件，即.class文件，其中就包含了大量的字节码指令。因此可以将javac命令理解为一个翻译命令，将源文件翻译成Jvm可以执行的指令。
那么最直观的探究方法莫过于直接对比翻译前后的内容。
具体如何对比呢？就不得不用到Java为我们一直默默提供的一项利器，javap命令，它可以解析字节码，将字节码内部逻辑以可读的方式呈现出来。为了紧贴实战，我们直接在新建的Java工程里，写这样一个UserServiceImpl类，里面包含几个由简单到复杂的方法，以及一个名为serviceType的属性：

如图，以上方法，复杂度由低到高依次为：getServiceType<setServiceType<genToken<login（以及一个实例代码块），后面我也会按照这个顺序解读其字节码指令的执行逻辑。
下面我们编译工程，然后在下图所示的目录(gradle编译工程)找到该类的字节码文件：

图片描述

cd到这个路径下，运行javap命令：

javap -v -p UserServiceImpl

就可以观看到翻译版的Java字节码的胴体了！这里的-v意思是啰嗦模式，会输出全面的字节码信息，而-p是指涵盖所有成员。原字节码信息输出内容较多，基于本文的目标，取其一方法的内容，整理如下图：
方法1，getServiceType()：

图片描述

这个getServiceType的方法应该是再简单不过的Java代码，翻译成字节码后也变成了三行，我们先来简单推理一下：第一句，aload_0不知所云，索性略过；第二行，getfield应该可以读懂，后面这个#8似乎是他的参数（实际上是对常量池的引用），//后面注释的内容是javap给我们加上的，意思应该是#8的指向是"Field serviceType:Ljava/lang/String;"这个内容。
所以getfield这一行就是取出serviceType这个字段喽，so easy。areturn肯定就是return的意思，a的含义也先略过不表。总之就是取出serviceType字段然后return喽。

那么现在的问题就是aload_0是什么意思了，看似多余，但仔细思考一下，似乎之前给getfield指令传入了“Field serviceType:Ljava/lang/String;”这样一个并不完整的参数，其后半部分的“Ljava/lang/String;”仅仅表示这个serviceType字段的类型是String，也就是说，整个参数里没有说是取的谁的serviceType字段啊！究竟是get谁的feild呢？

由此可以想到：aload操作一定是在为getfield指令准备了一个主体。

实际上，再结合下面的局部变量表，aload_0中的0正是局部变量表里的Slot 0的含义。意思是将局部变量表里的Slot 0的东西压入操作数栈，这个Slot 0里的东西name正是this，也就是UserServiceImpl的实例，即getfield的主体。

大戏上演

好了，对于小白同学有些陌生的概念来了，啥是操作数栈？啥是局部变量表？
其实这两个东西理解好了，关于虚拟机指令就懂了一大半了。
那么，不妨删繁就简，由易入难，先讲一个这样的故事，故事起名叫：

Java方法之创世纪

话说Jvm大帝是神之旨意的履行者（Jvm大帝就是虚拟机，神就是开发者，神之旨意是开发者写好并编译后的字节码...），当Jvm大帝带领Java世界运行进入了一个新的方法后，会为这个方法在栈内存大陆上创造两个重要的领域：局部变量表和操作数栈。

要有栈。要有表。神说。

依照神之旨意，jvm大帝创造的局部变量表里一般会包含this指针（针对实例方法，静态方法当然无此）、方法的所有传入参数和方法中所开辟的本地变量。

那么操作数栈是干嘛用的呢？

我们再引入另外一个比喻，如果把运行Java方法理解为拍戏，那么局部变量表里的各个局部变量就是这部戏的核心主角，或者说领衔主演，而操作数栈正是这部戏的舞台。所谓操作数栈搭台，局部变量唱戏，是也。那么aload_0就是告诉Jvm导演（大帝已沦落为导演），请0号演员this同志登台（压栈），演后边的本子。
当然了，这个比喻并不完全恰当，因为操作数栈并不是“舞台”的结构，而是栈的结构。但是这个比喻可以很好地说明局部变量表和操作数栈之间的关系，以及aload_0的作用。

下面我们用一张图来演示一下getServiceType这个小剧本桥段所导演的故事：

图片描述

好吧这部剧虽然短的可怜，但已经基本把指令、操作数栈和局部变量表三者的关系演绎了出来。
值得注意的是，getfield这条指令对操作数栈进行了复合操作，其流程可以示意如下图：

弹出->取值->压回

后面我们将要接触到的许多指令都如此，指令内部执行了弹出—>处理—>压回的流程。
下面我们就来分析一个相对复杂一点的方法，setServiceType(String)，如下图：

图片描述

这里我们看到，变化主要有，指令多了一行，多进行了一次aload，getfield变成了putfield，areturn变成了return，仅此而已。另外领衔主演也就是局部变量表里多了一位，也就是方法的传入参数serviceType字符串对象了。其情节如下：

图片描述

这里，putfield只弹出栈内的操作数，而没有向操作数栈压回任何数据，而且执行putfield之前，栈内元素的位置也必须符合“值在上，主体在下”要求。
而最后的return仅表示方法结束，而不会像areturn一样返回栈顶元素。这也印证了setServiceType(String)方法没有返回参数。

融会贯通

相信有了以上的讲解，大家对指令、操作数栈、局部变量表三者的运作关系有了一定认识，为了后边能够分析更复杂的方法，这里必须概括性地讲解一下更多的Java字节码指令。虽然Java字节码指令非常多，但其实常用的不外乎几个类别，先从这几个常用类别入手理解，便可渐入佳境。
关于字节码指令的分类，可以从两个维度进行：一是指令的功能，二是指令操作的数据类型。我们先从功能说起，指令主要可以分为如下几类：

存储和加载类指令：主要包括load系列指令、store系列指令和ldc、push系列指令，主要用于在局部变量表、操作数栈和常量池三者之间进行数据调度；（关于常量池前面没有特别讲解，这个也很简单，顾名思义，就是这个池子里放着各种常量，好比片场的道具库）
对象操作指令（创建与读写访问）：比如我们刚刚的putfield和getfield就属于读写访问的指令，此外还有putstatic/getstatic，还有new系列指令，以及instanceof等指令。
操作数栈管理指令：如pop和dup，他们只对操作数栈进行操作。
类型转换指令和运算指令：如add/div/l2i等系列指令，实际上这类指令一般也只对操作数栈进行操作。
控制跳转指令：这类里包含常用的if系列指令以及goto类指令。
方法调用和返回指令：主要包括invoke系列指令和return系列指令。这类指令也意味这一个方法空间的开辟和结束，即invoke会唤醒一个新的java方法小宇宙（新的栈和局部变量表），而return则意味着这个宇宙的结束回收。

如下图，展示了各类指令的作用：

图片描述

再从另外一个维度，即指令操作的数据类型来讲：指令开头或尾部的一些字母，就往往表明了它所能操作的数据类型：

a对应对象，表示指令操作对象性数据，比如aload和astore、areturn等等。
i对应整形。也就有iload，istore等i系列指令。
f对应浮点型。
l对应long，b对应byte，d对应double，c对应char。
另外地，ia对应int array，aa对应object array，da对应double array。不在一一赘述。

了解了以上内容，我们再去看最后几个方法，应该就会容易理解很多了。
下面我们就直捣黄龙genToken这个方法(图中的颜色暗示了指令和方法调用之间的关系)：

这个过程简单解读如下：
1.new一个StringBuilder对象（在堆内存中开辟空间），并将其引用入栈，用于实现加号连接字符串功能（相当于C++中的运算符重载）；
2.dup复制栈顶的刚刚放入的引用，再次压栈，这时栈里有两个重复的内容，深度为2；
3.调用并弹出栈顶StringBuilder引用对象的<init>方法，栈深度为1；
4.（绿色部分）调用UUID.randomUUID()静态方法，结果压栈后弹出调用String的toString方法，再压栈，栈深度为2；
5.（黄色部分）将"-"和""字符压栈，此时栈深度为4，弹出（栈顶3个元素）调用replace方法，结果压栈，深度为2；
6.调用StringBuilder对象的append方法，结果压栈，深度为1；
7.（蓝色部分）将参数user压栈并调用hashCode方法，结果压栈，深度为2；
8.调用StringBuilder对象的append方法（此处和上面的append调用共同完成了加号功能，在图中为红色部分），结果压栈，深度为1，再调用toString方法后结果压栈，深度为1；
9.areturn返回栈顶对象。

再看这个包含if跳转的方法login：

如上图，图中已经说明的比较全面了，不再赘述。值得一提的是，Java的这种基于栈结构的指令，在设计上有一种非常简洁的美感，指令与指令之间并没有较重的依赖，每条指令仅仅与操作数栈等领域内的数据发生关系，充满着某种平衡与秩序感。因此也必须注意，几乎每条指令的运行都有其前提，比如在invokevirtual或invokespecial指令执行前，必须保证操作数栈内提前按顺序压入好所需的操作数，否则就会发生问题。
关于最复杂的onCreate方法，就不再啰嗦解读了，读者可以前往我的github上的对应demo repo，进入tutorial分支，拉取源码和教程资源，或者自己写demo体验这一完整过程。
地址：https://github.com/BryanSharp...

后话

关于实战，一是可以学习使用强大开源工具ASM.jar；二是，可以参考本人的另一篇文章：Java字节码修改神器HiBeaver：黑掉你的SDK以及一次Android字节码插桩实战，利用hibeaver这个助手，开发者可以非常灵活地对字节码进行修改，插入指令，hook代码，甚至建立一些简单的AOP框架，对于Java字节码学习大有裨益。
hibeaver完全开源，github项目地址：https://github.com/BryanSharp...

祝玩的愉快！
本文如有不妥之处，欢迎交流指正。

另外，本文为了尽可能地简明生动、直入核心，简化了很多概念和细节，读者须知实际情况的更为复杂。但相信在理解了本文以后，就可以抓住Java字节码指令的核心理念，也就算扣开虚拟机学习的大门并可以开始读书精进了。下面盗图一张（后有出处），可作拓展：

图片描述

posted @ 2022-04-27 22:43 CharyGao 阅读(156) 评论(0) 收藏举报

刷新页面返回顶部

硅基文明

代码改变不了世界，但是改变世界需要代码。

Java 强/弱/软引用,Java字节码指令

引用的强弱程度

强引用 Strong Reference

方法中的强引用

全局强引用

软引用 SoftReference

弱引用 WeakReference

前言

单刀直入

大戏上演

融会贯通

后话