String类中intern方法的原理分析

一,前言

​ 昨天简单整理了JVM内存分配和String类常用方法,遇到了String中的intern()方法。本来想一并总结起来,但是intern方法还涉及到JDK版本的问题,内容也相对较多,所以今天就弥补昨天缺失的知识点。

二,String.intern()

​ 先来看下网上流行的关于intern()方法的示例代码:

public static void main(String[] args) {
    String s = new String("1");
    s.intern();
    String s2 = "1";
    System.out.println(s == s2);
 
    String s3 = new String("1") + new String("1");
    s3.intern();
    String s4 = "11";
    System.out.println(s3 == s4);
}

打印结果是:

​ JDK6:false,false

​ JDK7:false,true

首先我们先来回顾一个概念:

  • jdk6及以前中常量池是存放在方法区中。
  • jdk7常量池移动到堆中

​ 为什么要移动?常量池主要是存储加载类的信息,编译器生成的字面量和符号引用等。它的大小大约只有4M,如果大量使用intern()方法,便会造成常量池内除溢出的情况,同时GC回收也有一定的困难度。而且在jdk8以后,连Perm区域都没有了,被替换成了元区域。

​ 接着我们再来说说上面两种情况不同的结果。

JDK6:

String s = new String("1");

​ 1,这句代码实际上是生成两个实例对象,先在常量池中声明为1的字符对象,再通过关键字new生成1的字符对象并被s引用。

​ 2,接着s.intern();先在常量池中查找是否有相应的字符串存在,如果有,直接返回引用,否则,在常量池中生成相应的字符串并返回引用

​ 3,而String s2 = "1";是属于符号引用,直接在常量池中生成。

​ 4,最后判断s 是否与s2相等,通过上面的分析,s指向的是通过关键字new出来的在堆中的字符对象,而s2是符号引用的在常量池中的字符对象,所以返回的结果为false。如下图所示:

String s3 = new String("1") + new String("1");同理这句代码实际上也是产生2个字符对象,其原理和上面分析是一样的,而最后判断s3与s4的值,结果还是一个堆中的s3与常量池中的s4比较,那返回的结果必然是false。

JDK7:

    String s1 = new String("1");
    s1.intern();
    String s2 = "1";
    System.out.println(s == s2);

​ 1,这一部分代码与jdk6中的分析是类似的,但唯一不同的是s1.intern();返回的是在常量池中的引用,并不会在常量池中复制一份再返回引用

String s2 = "1";s1.intern();指向的是同一个引用。

​ 2,最后比较s与s2的值,s是堆中,s2是常量池中,因而返回结果为false。

​ 3,接着我们再来看下面一段代码:

        String s3 = new String("1") + new String("1");
        s3.intern();
        String s4 = "11";
        System.out.println(s3 == s4);

​ 我们先来分析第一句代码,同样是生成两个字符对象,先在常量池中生成为1的字符对象,再在堆中生成s3为11的字符对象。接着s3.intern();执行便去常量池中查询是否存在为11的字符对象,但是发现没有。这个时候在jdk7中便不会再复制一份为11到常量池中,而是直接返回堆中11的字符对象的引用。所以它与s3的引用地址是相同的。

String s4 = "11";这句代码是符号引用,直接去常量池中创建,但是发现池中已经存在为11的字符对象的引用,因此直接返回该引用。最后判断s3与s4是否相等,因为它们之间的引用的相同的,所以返回的结果为true。如下图所示:

三,补充内容

​ 本以为写到这里就结束了,没想到一位评论者告诉我在jdk8中,对于intern方法的处理与jdk7是不一样的。在这里非常感谢,是我的疏忽。

​ 下面请看jdk8中关于intern方法的源码解释:

/**
     * Returns a canonical representation for the string object.
     * <p>
     * A pool of strings, initially empty, is maintained privately by the
     * class {@code String}.
     * <p>
     * When the intern method is invoked, if the pool already contains a
     * string equal to this {@code String} object as determined by
     * the {@link #equals(Object)} method, then the string from the pool is
     * returned. Otherwise, this {@code String} object is added to the
     * pool and a reference to this {@code String} object is returned.
     * <p>
     * It follows that for any two strings {@code s} and {@code t},
     * {@code s.intern() == t.intern()} is {@code true}
     * if and only if {@code s.equals(t)} is {@code true}.
     * <p>
     * All literal strings and string-valued constant expressions are
     * interned. String literals are defined in section 3.10.5 of the
     * <cite>The Java&trade; Language Specification</cite>.
     *
     * @return  a string that has the same contents as this string, but is
     *          guaranteed to be from a pool of unique strings.
     */

​ 大致解释一下就是说,当调用intern()方法时,如果池已经包含string这个对象时,由equals(Object)方法去比较,则池中的字符串为返回。否则,将此String对象添加到池和对这个String对象的引用被返回。

四,总结

​ 1,对于常量池的概念要注意jdk6与jdk7之间的变化。

​ 2,intern()方法在不同jdk版本之间的变化,jdk7中如果常量池中不存在,不会再复制一份到常量池中,而是返回堆中的存在的引用地址。

​ 3,jdk6常量池在方法区中,jdk7常量池在堆中,jdk8取消方法区,替换成元区域。

​ 最后关于String类中intern方法就介绍这里,其实从实际开发工作中,我们只需要了解jdk7及以后版本的原理就可以了,毕竟现在市面上很少再用jdk6版本。但是这里总结出来也是为了更方便的参照理解,同时也涉及到一些关于JVM内存的相关知识,本篇博客是接着上一篇内容的缺失的知识点。

​ 以上内容均是自主学习总结的,如有不适之处还请留言(邮箱)指教。

感谢阅读!

posted @ 2019-09-03 11:02 奋进的小样 阅读(...) 评论(...) 编辑 收藏