浅谈Java String内幕

作者: 美团Java | 来源:发表于2016-08-29 13:35 被阅读7748次

简书 占小狼
转载请注明原创出处,谢谢!

前言

String字符串在Java应用中使用非常频繁,只有理解了它在虚拟机中的实现机制,才能写出健壮的应用,本文使用的JDK版本为1.8.0_3。

常量池

Java代码被编译成class文件时,会生成一个常量池(Constant pool)的数据结构,用以保存字面常量和符号引用(类名、方法名、接口名和字段名等)。

package com.ctrip.ttd.whywhy;
public class Test {  
    public static void main(String[] args) {  
        String test = "test";  
    }  
}  

很简单的一段代码,通过命令 javap -verbose 查看class文件中 Constant pool 实现:

Constant pool:
   #1 = Methodref          #4.#13         // java/lang/Object."<init>":()V
   #2 = String             #14            // test
   #3 = Class              #15            // com/ctrip/ttd/whywhy/test
   #4 = Class              #16            // java/lang/Object
   #5 = Utf8               <init>
   #6 = Utf8               ()V
   #7 = Utf8               Code
   #8 = Utf8               LineNumberTable
   #9 = Utf8               main
  #10 = Utf8               ([Ljava/lang/String;)V
  #11 = Utf8               SourceFile
  #12 = Utf8               test.java
  #13 = NameAndType        #5:#6          // "<init>":()V
  #14 = Utf8               test
  #15 = Utf8               com/ctrip/ttd/whywhy/test
  #16 = Utf8               java/lang/Object

通过反编译出来的字节码可以看出字符串 "test" 在常量池中的定义方式:

#2 = String             #14            // test
#14 = Utf8              test

在main方法字节码指令中,0 ~ 2行对应代码 String test = "test"; 由两部分组成:ldc #2 和 astore_1。

 // main方法字节码指令
 public static void main(java.lang.String[]);
   Code:
      0: ldc           #2                  // String test
      2: astore_1
      3: return

1、Test类加载到虚拟机时,"test"字符串在Constant pool中使用符号引用symbol表示,当调用 ldc #2 指令时,如果Constant pool中索引 #2 的symbol还未解析,则调用C++底层的 StringTable::intern 方法生成char数组,并将引用保存在StringTable和常量池中,当下次调用 ldc #2 时,可以直接从Constant pool根据索引 #2获取 "test" 字符串的引用,避免再次到StringTable中查找。

2、astore_1指令将"test"字符串的引用保存在局部变量表中。

常量池的内存分配 在 JDK6、7、8中有不同的实现:
1、JDK6及之前版本中,常量池的内存在永久代PermGen进行分配,所以常量池会受到PermGen内存大小的限制。
2、JDK7中,常量池的内存在Java堆上进行分配,意味着常量池不受固定大小的限制了。
3、JDK8中,虚拟机团队移除了永久代PermGen。

字符串初始化

字符串可以通过两种方式进行初始化:字面常量和String对象。

字面常量

public class StringTest {
    public static void main(String[] args) {
        String a = "java";
        String b = "java";
        String c = "ja" + "va";
    }
}

通过 "javap -c" 命令查看字节码指令实现:


其中ldc指令将int、float和String类型的常量值从常量池中推送到栈顶,所以a和b都指向常量池的"java"字符串。通过指令实现可以发现:变量a、b和c都指向常量池的 "java" 字符串,表达式 "ja" + "va" 在编译期间会把结果值"java"直接赋值给c。

String对象

public class StringTest {
    public static void main(String[] args) {
        String a = "java";
        String c = new String("java");
    }
}

这种情况下,a == c 成立么?字节码实现如下:


其中3 ~ 9行指令对应代码 String c = new String("java"); 实现:
1、第3行new指令,在Java堆上为String对象申请内存;
2、第7行ldc指令,尝试从常量池中获取"java"字符串,如果常量池中不存在,则在常量池中新建"java"字符串,并返回;
3、第9行invokespecial指令,调用构造方法,初始化String对象。

其中String对象中使用char数组存储字符串,变量a指向常量池的"java"字符串,变量c指向Java堆的String对象,且该对象的char数组指向常量池的"java"字符串,所以很显然 a != c,如下图所示:


**通过 "字面量 + String对象" 进行赋值会发生什么? **

public class StringTest {
    public static void main(String[] args) {
        String a = "hello ";
        String b = "world";
        String c = a + b;
        String d = "hello world";
    }
}

这种情况下,c == d成立么?字节码实现如下:


其中6 ~ 21行指令对应代码 String c = a + b; 实现:
1、第6行new指令,在Java堆上为StringBuilder对象申请内存;
2、第10行invokespecial指令,调用构造方法,初始化StringBuilder对象;
3、第14、18行invokespecial指令,调用append方法,添加a和b字符串;
4、第21行invokespecial指令,调用toString方法,生成String对象。

通过指令实现可以发现,字符串变量的连接动作,在编译阶段会被转化成StringBuilder的append操作,变量c最终指向Java堆上新建String对象,变量d指向常量池的"hello world"字符串,所以 c != d。

不过有种特殊情况,当final修饰的变量发生连接动作时,虚拟机会进行优化,将表达式结果直接赋值给目标变量:

public class StringTest {
    public static void main(String[] args) {
        final String a = "hello ";
        final String b = "world";
        String c = a + b;
        String d = "hello world";
    }
}

指令实现如下:

END。
我是占小狼。
在魔都艰苦奋斗,白天是上班族,晚上是知识服务工作者。
如果读完觉得有收获的话,记得关注和点赞哦。
非要打赏的话,我也是不会拒绝的。

相关文章

  • 浅谈Java String内幕

    简书 占小狼转载请注明原创出处,谢谢! 前言 String字符串在Java应用中使用非常频繁,只有理解了它在虚拟机...

  • 浅谈StringBuilder

    简书 占小狼转载请注明原创出处,谢谢! 连接符号 "+" 本质 在 浅谈Java String内幕(1) 中,字符...

  • Java中String、StringBuilder和String

    参考浅谈Java字符串Java之字符串操作String、StringBuilder和StringBuffer

  • 2017计划

    小鱼计划 读书 effective java,深入Java虚拟机,spring内幕,MySQL技术内幕, head...

  • Java

    1. JVM 你真的了解String类的intern()方法吗? Java虚拟机架构 内存管理和垃圾回收 浅谈JV...

  • 浅谈Java String.intern()

    简书 占小狼转载请注明原创出处,谢谢! String.intern()原理 String.intern()是一个N...

  • 浅谈java中的String

    第一,简介 String是java语言非常基础和重要的类,提供了构造和管理字符串的各种基本逻辑。它是典型的immu...

  • 浅谈String、StringBuffer和StringBuil

    浅谈String、StringBuffer和StringBuild的区别 一、可变与否 String是不可变的,是...

  • String 总结

    Java String类 Java lang.String类用法实例教程。 简介java.lang.String类...

  • 2019-08-20

    浅谈String、StringBuffer 、StringBuilder和StringJoiner 可变性 Str...

网友评论

  • 吃饱了就送:作者你好,请教一下,String a = “test”,字符串内容test存放在常量池中,那a存放在哪?
    美团Java:@吃饱了就送 a在栈
  • amourling://拼接一:
    String c = "ja" + "va";
    //拼接二:
    String c1="ja";String c2="va";
    String c=c1+c2;

    这两种拼接通过字节码可以发现不是同一种操作,
  • 相互交流:楼主使用命令javap -c找不到java类,,?是什么原因,还是我使用的姿势不对。。。
    易海峰:@相互交流 第一包不对 第二在正确的包下面没有先执行 javac
    相互交流: @占小狼 这样姿势才对啊
    美团Java:@相互交流 肯定姿势不对
  • 飞浪人:楼主,请教一下:String s = new String("a");//a 在常量池中不存在 创建一个这样的对象,需要消耗的内存是不是:String对象占用的内存 + char[] 占用的内存?我自己测了一下两个加起来有48 bytes。如果我要创建大量的String对象岂不是浪费了很多内存,这种情况有好的解决方法吗?
    :pray:
  • come_true:学习了
  • fcd4b51bb6e2:不错,我已支持
    美团Java:@studyxiaoxi 感谢
  • minjie0128:请问一下 你知道第二张截图的 dup指令有什么用吗? 这个指令的意思是 复制栈顶的值,这样栈顶就有2个对象的引用了,为什么要这么做呢?
    美团Java:@时之结绳 之前是,哈哈
    康康不遛猫:com.ctrip.ttd.whywhy;
    小狼是携程的呀,:smiley:
    美团Java:@minjie0128 栈顶原来是没有对象引用的,执行dup之后,栈中才有引用指向字符串
  • 被称为L的男人:楼主总结得很全面,我也零碎在简书上发表文章,期待互相交流。
  • ab0d6913a23d:很详细,简洁,加油并谢谢!
    美团Java:@bugken 多谢肯定

本文标题:浅谈Java String内幕

本文链接:https://www.haomeiwen.com/subject/txivsttx.html