资深架构师教你String 常量池、 String.itern()

什么是常量

用final修饰的成员变量表示常量，值一旦给定就无法改变！

final修饰的变量有三种：静态变量、实例变量和局部变量，分别表示三种类型的常量。

Class文件中的常量池

在Class文件结构中，最头的4个字节用于存储魔数Magic Number，用于确定一个文件是否能被JVM接受，再接着4个字节用于存储版本号，前2个字节存储次版本号，后2个存储主版本号，再接着是用于存放常量的常量池，由于常量的数量是不固定的，所以常量池的入口放置一个U2类型的数据(constant_pool_count)存储常量池容量计数值。

常量池主要用于存放两大类常量：字面量(Literal)和符号引用量(Symbolic References)，字面量相当于Java语言层面常量的概念，如文本字符串，声明为final的常量值等，符号引用则属于编译原理方面的概念，包括了如下三种类型的常量：

类和接口的全限定名
字段名称和描述符
方法名称和描述符

方法区中的运行时常量池

运行时常量池是方法区的一部分。

CLass文件中除了有类的版本、字段、方法、接口等描述信息外，还有一项信息是常量池，用于存放编译期生成的各种字面量和符号引用，这部分内容将在类加载后进入方法区的运行时常量池中存放。

运行时常量池相对于CLass文件常量池的另外一个重要特征是具备动态性，Java语言并不要求常量一定只有编译期才能产生，也就是并非预置入CLass文件中常量池的内容才能进入方法区运行时常量池，运行期间也可能将新的常量放入池中，这种特性被开发人员利用比较多的就是String类的intern()方法。

常量池的好处

常量池是为了避免频繁的创建和销毁对象而影响系统性能，其实现了对象的共享。

例如字符串常量池，在编译阶段就把所有的字符串文字放到一个常量池中。

（1）节省内存空间：常量池中所有相同的字符串常量被合并，只占用一个空间。

（2）节省运行时间：比较字符串时，==比equals()快。对于两个引用变量，只用==判断引用是否相等，也就可以判断实际值是否相等。

双等号==的含义

基本数据类型之间应用双等号，比较的是他们的数值。

复合数据类型(类)之间应用双等号，比较的是他们在内存中的存放地址。

几种基本类型的包装类和常量池

java中基本类型的包装类的大部分都实现了常量池技术，

即Byte,Short,Integer,Long,Character,Boolean；

Integer i1 = 40;Integer i2 = 40;System.out.println(i1==i2);//输出TRUE

这5种包装类默认创建了数值[-128，127]的相应类型的缓存数据，但是超出此范围仍然会去创建新的对象。

//Integer 缓存代码 ：public static Integer valueOf(int i) { assert IntegerCache.high >= 127; if (i >= IntegerCache.low && i <= IntegerCache.high) return IntegerCache.cache[i + (-IntegerCache.low)]; return new Integer(i);
}

Integer i1 = 400;
Integer i2 = 400;
System.out.println(i1==i2);//输出false

两种浮点数类型的包装类Float,Double并没有实现常量池技术。
```
Double i1=1.2;
Double i2=1.2;
System.out.println(i1==i2);//输出false
```
应用常量池的场景

(1)Integer i1=40；Java在编译的时候会直接将代码封装成Integer i1=Integer.valueOf(40);，从而使用常量池中的对象。

(2)Integer i1 = new Integer(40);这种情况下会创建新的对象。
```
Integer i1 = 40;
Integer i2 = new Integer(40);
System.out.println(i1==i2);//输出false
```

String.itern()的基本原理

String.intern()是一个Native方法，底层调用C++的 StringTable::intern 方法，源码注释：当调用 intern 方法时，如果常量池中已经该字符串，则返回池中的字符串；否则将此字符串添加到常量池中，并返回字符串的引用。

所以明面上，它有两大好处，一是重复的字符串，会用同一个引用代替；二是字符串比较，不再需要逐个字符的equals()比较，而用==对比引用是否相同即可。

省内存效果只对长期存在的字符串有效

String.intern()没有神奇的地方，只在字符串生成后，再去常量池里查找引用。所以字符串最初生成时所花的内存，是省不掉的。

String s ＝ new String(bytes, “UTF-8”).intern();

String s = String.valueOf(i).intern();

只有大量对象放在长期存在的集合里，里面是大量重复的字符串，或者对象的属性是重复的字符串时，省内存的效果才显现出来。短生命周期的字符串，GC要干的活是一样的。

执行路径上多次的==，才能抵消常量池HasHMap查找的代价

==当然比equals()快得多，但常量池其实是个HashMap，依然没有神奇的地方，依然要执行HashMap的get操作，所以，一次hashCode() 和至少一次的equals()已经预付了，如果hash冲突，那equals()次数更多。

真的对性能影响甚微吗？

在我的服务化框架测试里，把几个Header字段intern了，性能立马从七万五调到七万一 QPS，原来从七万一升到七万五，曾做过多少效果甚微的优化加上一次Netty使用的优化而成，现在它掉下来倒是飞快。

PS. 七万五 20%CPU这个数字，这两周的博客里都没升过了: (

小陷阱

来自R大的提醒， s.intern()是无效的，因为String是不变对象， String s1 = s.intern()后，这个s1才是个引用。

posted @ 2019-09-16 16:25 Java架构Monster 阅读(474) 评论(0) 收藏举报

刷新页面返回顶部

Java架构Monster

资深架构师教你String 常量池、 String.itern()

什么是常量

String.itern()的基本原理

公告