Class常量池与运行时常量池

# Class 常量池与运行时常量池

# 概述

Class常量池可以理解为是Class文件中的资源仓库。 Class文件中除了包含类的版本、字段、方法、接口等描述信息外，还有一项信息就是常量池(constant pool table)，用于存放编译期生成的各种字面量(Literal)和符号引用(Symbolic References)。

一个class文件的16进制大体结构如下图：

对应的含义如下，细节可以查下oracle官方文档

当然我们一般不会去人工解析这种16进制的字节码文件，我们一般可以通过javap命令生成更可读的JVM字节码指令文件：javap -v Math.class

红框标出的就是class常量池信息，常量池中主要存放两大类常量：字面量和符号引用。

# 字面量

字面量是源码里直接写出的固定值，如字符串 "abc"、整数 1 等。在 Java 中，字符串字面量会被驻留到运行时的**字符串常量池（String Intern Pool）**中，保证相同内容只保留一份。

# 1）基本示例

int a = 1;               // 1 是数值字面量
int b = 2;               // 2 是数值字面量
String c = "abcdefg";    // "abcdefg" 是字符串字面量（进字符串常量池）
String d = "abcdefg";    // 复用池中同一实例：c == d 为 true

1
2
3
4

# 2）“隐形字面量”：`new String("abc")`

new String("abc") 的参数位置也出现了字面量 "abc"。流程如下：

加载字面量：字节码里会有 ldc "abc"，把池中的那份 "abc" 引用压栈作为构造参数；
新建对象：new String(...) 在堆上再创建一个新的 String 实例；
引用不相等：因此与池中那份不是同一引用，除非随后 intern()。

String a = "abc";                 // a 指向池中对象
String b = new String("abc");     // b 指向堆中新对象；构造参数来自池
System.out.println(a == b);       // false
System.out.println(a.equals(b));  // true

String c = new String("abc").intern();
System.out.println(a == c);       // true：返回池中唯一引用

1
2
3
4
5
6
7

证明思路：用 javap -v 可看到 ldc "abc" 与 new/invokespecial 指令。

# 3）编译期常量折叠 vs. 运行期拼接

编译期可折叠的拼接会直接生成一个字面量，入池：

String x = "ab" + "c"; // 编译器折叠为 "abc"（池中对象）

运行期拼接（含变量）得到的是堆对象，除非再 intern()：

String p = "ab";
String q = p + "c";    // 运行期 StringBuilder 拼接（堆对象）

1
2

# 4）两个“常量池”要区分

Class 文件常量池：存放常量/符号引用（编译产物），例如 "abc" 的常量项；
运行时字符串常量池（StringTable）：真正驻留并复用的 String 实例。

# 5）最佳实践小结

写字符串时优先字面量或可折叠常量；避免无意义的 new String("…")。
内容比较用 equals；只有明确需要同一引用时才依赖 == 或 intern()。
大量去重或协议表征场景再评估 intern() 的收益/内存成本（JDK7+ 池在堆上）。

// 1) 字面量重用
String s1 = "abc";
String s2 = "abc";
assert s1 == s2;

// 2) 含 new 的“隐形字面量”
String s3 = new String("abc"); // 参数字面量来自池；本行仍建了堆对象
assert s1 != s3 && s1.equals(s3);

// 3) 运行期拼接
String base = "a";
String s4 = base + "bc";       // 堆对象
assert s4 != s1;

// 4) intern 返回池中引用
String s5 = s4.intern();
assert s5 == s1;

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

# 符号引用

符号引用是编译原理中的概念，是相对于直接引用来说的。主要包括了以下三类常量：

类和接口的全限定名
字段的名称和描述符
方法的名称和描述符

上面的a，b就是字段名称，就是一种符号引用，还有Math类常量池里的 Lcom/tuling/jvm/Math 是类的全限定名，main和compute是方法名称，()是一种UTF8格式的描述符，这些都是符号引用。

这些常量池现在是静态信息，只有到运行时被加载到内存后，这些符号才有对应的内存地址信息，这些常量池一旦被装入内存就变成运行时常量池，对应的符号引用在程序加载或运行时会被转变为被加载到内存区域的代码的直接引用，也就是我们说的

动态链接了。例如，compute()这个符号引用在运行时就会被转变为compute()方法具体代码在内存中的地址，主要通过对象头里的类型指针去转换直接引用。

# 字符串常量池

# 本质

public class InternDemo {
    public static void main(String[] args) {
        // 例1：先构造，再 intern，再用字面量 —— s1 与 "ab" 同一份
        String s1 = new String("a") + new String("b"); // 堆上新建一个 "ab"
        s1.intern();                                   // 把“指向 s1 那个堆对象”的引用登记到 StringTable
        String l1 = "ab";                              // 取池里那份（其实就是 s1 指向的那份）
        System.out.println("例1: s1 == l1 ? " + (s1 == l1)); // true

        // 例2：先用字面量，再构造，再 intern —— s2 与 "ab" 不是同一份
        String l2 = "ab";                              // 池里已有 "ab" 的条目，指向一份堆对象
        String s2 = new String("a") + new String("b"); // 又在堆上新建一份 "ab"
        s2.intern();                                   // 发现池里已有，不改表项，不返回 s2 那份
        System.out.println("例2: s2 == l2 ? " + (s2 == l2)); // false
    }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

解释（抓住这三点就够）：

StringTable 不是放“另一份对象”的地方，而是一张哈希表，表项里存的是指向堆上某个 String 对象的引用。
运行期拼接 new String("a") + new String("b") 只会在堆上新建 "ab"，不会自动登记到池；只有字面量或显式调用 intern() 才会把该内容登记到池（若还没有）。
例1中，首次 s1.intern() 时池里没有 "ab"，于是把指向 s1 那个堆对象的引用登记进池，所以后面的字面量 "ab" 取到的就是同一份 ⇒ true。例2中，字面量先占了池的条目，后面再拼接出的 s2 是另一份堆对象；s2.intern() 看到已存在，就不改表项 ⇒ false。

池是电话簿，放的是“内容 → 引用”；对象都在堆上。

谁先登记，谁当官方（JDK7+）：第一次出现该内容的那份对象引用被登记为“官方”。

intern() = 查或登：池里有就返回官方引用；没有就把我自己登记成官方并返回。

== 比的是引用（有没有同一“官方号码”），不是内容。

# 例子 1：`new String("abc")` 到底几个对象？

String a = new String("abc");
String b = a.intern();

System.out.println(a == b);        // false
System.out.println(a.equals(b));   // true

1
2
3
4
5

两个 String 对象：
- 官方 L：由字面量 "abc" 触发并登记到池（对象在堆）。
- 新对象 S：new String(L) 构造出的那份，a 指向它。
a.intern() 返回池里的官方 L，所以 a == b 为 false。

# 字符串常量池的设计思想

字符串的分配，和其他的对象分配一样，耗费高昂的时间与空间代价，作为最基础的数据类型，大量频繁的创建字符串，极大程度地影响程序的性能

JVM为了提高性能和减少内存开销，在实例化字符串常量的时候进行了一些优化

为字符串开辟一个字符串常量池，类似于缓存区

创建字符串常量时，首先查询字符串常量池是否存在该字符串

存在该字符串，返回引用实例，不存在，实例化该字符串并放入池中

# 三种字符串操作(Jdk1.7 及以上版本)

# 直接赋值字符串

String s = "zhuge";  // s指向常量池中的引用

这种方式创建的字符串对象，只会在常量池中。

因为有"zhuge"这个字面量，创建对象s的时候，JVM会先去常量池中通过 equals(key) 方法，判断是否有相同的对象

如果有，则直接返回该对象在常量池中的引用；

如果没有，则会在常量池中创建一个新对象，再返回引用。

# new String();


String s1 = new String("zhuge");  // s1指向内存中的对象引用

1
2

这种方式会保证字符串常量池和堆中都有这个对象，没有就创建，最后返回堆内存中的对象引用。

步骤大致如下：

因为有"zhuge"这个字面量，所以会先检查字符串常量池中是否存在字符串"zhuge"

不存在，先在字符串常量池里创建一个字符串对象；再去内存中创建一个字符串对象"zhuge"；

存在的话，就直接去堆内存中创建一个字符串对象"zhuge"；

最后，将内存中的引用返回。

# intern方法

String s1 = new String("zhuge");  
String s2 = s1.intern();
System.out.println(s1 == s2);  //false

1
2
3

String中的intern方法是一个 native 的方法，当调用 intern方法时，如果池已经包含一个等于此String对象的字符串（用equals(oject)方法确定），则返回池中的字符串。否则，将intern返回的引用指向当前字符串 s1(jdk1.6版本需要将 s1 复制到字符串常量池里)。

# 字符串常量池位置

Jdk1.6及之前：有永久代, 运行时常量池在永久代，运行时常量池包含字符串常量池

Jdk1.7：有永久代，但已经逐步“去永久代”，字符串常量池从永久代里的运行时常量池分离到堆里

Jdk1.8及之后：无永久代，运行时常量池在元空间，字符串常量池里依然在堆里

用一个程序证明下字符串常量池在哪里：

/**
 * -Xms10M -Xmx10M
 */
public class RuntimeConstantPoolOOM{
    public static void main(String[] args) {
        ArrayList<String> list = new ArrayList<String>();
        for (int i = 0; i < 10000000; i++) {
            String str = String.valueOf(i).intern();
            list.add(str);
        }
    }
}

运行结果：
jdk7及以上：Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
jdk6：Exception in thread "main" java.lang.OutOfMemoryError: PermGen space

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

# 字符串常量池设计原理

字符串常量池底层是hotspot的C++实现的，底层类似一个 HashTable，保存的本质上是字符串对象的引用。

看一道比较常见的面试题，下面的代码创建了多少个 String 对象？

String s1 = new String("he") + new String("llo");
String s2 = s1.intern();
 
System.out.println(s1 == s2);
// 在 JDK 1.6 下输出是 false，创建了 6 个对象
// 在 JDK 1.7 及以上的版本输出是 true，创建了 5 个对象
// 当然我们这里没有考虑GC，但这些对象确实存在或存在过

1
2
3
4
5
6
7

为什么输出会有这些变化呢？主要还是字符串池从永久代中脱离、移入堆区的原因， intern() 方法也相应发生了变化：

1、在 JDK 1.6 中，调用 intern() 首先会在字符串池中寻找 equal() 相等的字符串，假如字符串存在就返回该字符串在字符串池中的引用；假如字符串不存在，虚拟机会重新在永久代上创建一个实例，将 StringTable 的一个表项指向这个新创建的实例。

2、在 JDK 1.7 (及以上版本)中，由于字符串池不在永久代了，intern() 做了一些修改，更方便地利用堆中的对象。字符串存在时和 JDK 1.6一样，但是字符串不存在时不再需要重新创建实例，可以直接指向堆上的实例。

由上面两个图，也不难理解为什么 JDK 1.6 字符串池溢出会抛出 OutOfMemoryError: PermGen space ，而在 JDK 1.7 及以上版本抛出 OutOfMemoryError: Java heap space 。

# String常量池问题的几个例子

示例1：

String s0="zhuge";
String s1="zhuge";
String s2="zhu" + "ge";
System.out.println( s0==s1 ); //true
System.out.println( s0==s2 ); //true

1
2
3
4
5

分析：因为例子中的 s0和s1中的”zhuge”都是字符串常量，它们在编译期就被确定了，所以s0==s1为true；而”zhu”和”ge”也都是字符串常量，当一个字符串由多个字符串常量连接而成时，它自己肯定也是字符串常量，所以s2也同样在编译期就被优化为一个字符串常量"zhuge"，所以s2也是常量池中” zhuge”的一个引用。所以我们得出s0==s1==s2；

示例2：

String s0="zhuge";
String s1=new String("zhuge");
String s2="zhu" + new String("ge");
System.out.println( s0==s1 );　　// false
System.out.println( s0==s2 )；　 // false
System.out.println( s1==s2 );　　// false

1
2
3
4
5
6

分析：用new String() 创建的字符串不是常量，不能在编译期就确定，所以new String() 创建的字符串不放入常量池中，它们有自己的地址空间。

s0还是常量池中"zhuge”的引用，s1因为无法在编译期确定，所以是运行时创建的新对象”zhuge”的引用，s2因为有后半部分 new String(”ge”)所以也无法在编译期确定，所以也是一个新创建对象”zhuge”的引用;明白了这些也就知道为何得出此结果了。

示例3：

String a = "a1";
String b = "a" + 1;
System.out.println(a == b); // true 
String a = "atrue";
String b = "a" + "true";
System.out.println(a == b); // true 

String a = "a3.4";
String b = "a" + 3.4;
System.out.println(a == b); // true

1
2
3
4
5
6
7
8
9
10

分析：JVM对于字符串常量的"+"号连接，将在程序编译期，JVM就将常量字符串的"+"连接优化为连接后的值，拿"a" + 1来说，经编译器优化后在class中就已经是a1。在编译期其字符串常量的值就确定下来，故上面程序最终的结果都为true。

示例4：

String a = "ab";
String bb = "b";
String b = "a" + bb;

System.out.println(a == b); // false

1
2
3
4
5

分析：JVM对于字符串引用，由于在字符串的"+"连接中，有字符串引用存在，而引用的值在程序编译期是无法确定的，即"a" + bb无法被编译器优化，只有在程序运行期来动态分配并将连接后的新地址赋给b。所以上面程序的结果也就为false。

示例5：

String a = "ab";
final String bb = "b";
String b = "a" + bb;

System.out.println(a == b); // true

1
2
3
4
5

分析：和示例4中唯一不同的是bb字符串加了final修饰，对于final修饰的变量，它在编译时被解析为常量值的一个本地拷贝存储到自己的常量池中或嵌入到它的字节码流中。所以此时的"a" + bb和"a" + "b"效果是一样的。故上面程序的结果为true。

示例6：

String a = "ab";
final String bb = getBB();
String b = "a" + bb;
System.out.println(a == b); // false
private static String getBB() {  
  return "b";  
}

1
2
3
4
5
6
7

分析：JVM对于字符串引用bb，它的值在编译期无法确定，只有在程序运行期调用方法后，将方法的返回值和"a"来动态连接并分配地址为b，故上面程序的结果为false。

# 关于String是不可变的

通过上面例子可以得出得知：

String  s  =  "a" + "b" + "c";  //就等价于String s = "abc";
String  a  =  "a";
String  b  =  "b";
String  c  =  "c";
String  s1  =   a  +  b  +  c;

1
2
3
4
5

s1 这个就不一样了，可以通过观察其JVM指令码发现s1的"+"操作会变成如下操作：

StringBuilder temp = new StringBuilder();
temp.append(a).append(b).append(c);
String s = temp.toString();

1
2
3

# 最后再看一个例子：

//字符串常量池："计算机"和"技术"     堆内存：str1引用的对象"计算机技术"  
//堆内存中还有个StringBuilder的对象，但是会被gc回收，StringBuilder的toString方法会new String()，这个String才是真正返回的对象引用
String str2 = new StringBuilder("计算机").append("技术").toString();   //没有出现"计算机技术"字面量，所以不会在常量池里生成"计算机技术"对象
System.out.println(str2 == str2.intern());  //true
//"计算机技术" 在池中没有，但是在heap中存在，则intern时，会直接返回该heap中的引用

//字符串常量池："ja"和"va"     堆内存：str1引用的对象"java"  
//堆内存中还有个StringBuilder的对象，但是会被gc回收，StringBuilder的toString方法会new String()，这个String才是真正返回的对象引用
String str1 = new StringBuilder("ja").append("va").toString();    //没有出现"java"字面量，所以不会在常量池里生成"java"对象
System.out.println(str1 == str1.intern());  //false
//java是关键字，在JVM初始化的相关类里肯定早就放进字符串常量池了

String s1=new String("test");  
System.out.println(s1==s1.intern());   //false
//"test"作为字面量，放入了池中，而new时s1指向的是heap中新生成的string对象，s1.intern()指向的是"test"字面量之前在池中生成的字符串对象

String s2=new StringBuilder("abc").toString();
System.out.println(s2==s2.intern());  //false
//同上

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

# 八种基本类型的包装类和对象池

java中基本类型的包装类的大部分都实现了常量池技术(严格来说应该叫**对象池，**在堆上)，这些类是Byte,Short,Integer,Long,Character,Boolean,另外两种浮点数类型的包装类则没有实现。另外Byte,Short,Integer,Long,Character这5种整型的包装类也只是在对应值小于等于127时才可使用对象池，也即对象不负责创建和管理大于127的这些类的对象。因为一般这种比较小的数用到的概率相对较大。

public class Test {
    public static void main(String[] args) {
        //5种整形的包装类Byte,Short,Integer,Long,Character的对象，  
        //在值小于127时可以使用对象池  
        Integer i1 = 127;  //这种调用底层实际是执行的Integer.valueOf(127)，里面用到了IntegerCache对象池
        Integer i2 = 127;
        System.out.println(i1 == i2);//输出true  

        //值大于127时，不会从对象池中取对象  
        Integer i3 = 128;
        Integer i4 = 128;
        System.out.println(i3 == i4);//输出false  
        
        //用new关键词新生成对象不会使用对象池
        Integer i5 = new Integer(127);  
        Integer i6 = new Integer(127);
        System.out.println(i5 == i6);//输出false 

        //Boolean类也实现了对象池技术  
        Boolean bool1 = true;
        Boolean bool2 = true;
        System.out.println(bool1 == bool2);//输出true  

        //浮点类型的包装类没有实现对象池技术  
        Double d1 = 1.0;
        Double d2 = 1.0;
        System.out.println(d1 == d2);//输出false  
    }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29

上次更新: 2025/10/16, 09:18:19

← JVM调优工具以及调优实战 arthas详解→

Class常量池与运行时常量池

# Class 常量池与运行时常量池

# 概述

# 字面量

# 1）基本示例

# 2）“隐形字面量”：new String("abc")

# 3）编译期常量折叠 vs. 运行期拼接

# 4）两个“常量池”要区分

# 5）最佳实践小结

# 符号引用

# 字符串常量池

# 本质

# 例子 1：new String("abc") 到底几个对象？

# 字符串常量池的设计思想

# 三种字符串操作(Jdk1.7 及以上版本)

# 直接赋值字符串

# new String();

# intern方法

# 字符串常量池位置

# 字符串常量池设计原理

# String常量池问题的几个例子

# 关于String是不可变的

# 最后再看一个例子：

# 八种基本类型的包装类和对象池

# 2）“隐形字面量”：`new String("abc")`

# 例子 1：`new String("abc")` 到底几个对象？