美文网首页Java 杂谈
关于String你还需要知道这些细节

关于String你还需要知道这些细节

作者: 三好码农 | 来源:发表于2018-07-24 09:07 被阅读48次

    关于String + 的故事

    只要是写Java的,String肯定是经常用的,比如下面这样的代码(可能我们都写烂了)

    String a = "Hello";
    String b = "java";
    String ab = a + b;
    

    我们也一直都是这样写的,但是如果我们再进一步想一下就会发现问题,String在java中是一个类,java中是没有运算符重载的,那么二个String为什么可以直接用 + 号进行拼接呢?为了一探究竟,我们还是要看编译后的字节码。

    L0
      LINENUMBER 18 L0
      LDC "Hello"
      ASTORE 1
    L1
      LINENUMBER 19 L1
      LDC "java"
      ASTORE 2
    L2
      LINENUMBER 20 L2
      NEW java/lang/StringBuilder
      DUP
      INVOKESPECIAL java/lang/StringBuilder.<init> ()V
      ALOAD 1
      INVOKEVIRTUAL java/lang/StringBuilder.append (Ljava/lang/String;)Ljava/lang/StringBuilder;
      ALOAD 2
      INVOKEVIRTUAL java/lang/StringBuilder.append (Ljava/lang/String;)Ljava/lang/StringBuilder;
      INVOKEVIRTUAL java/lang/StringBuilder.toString ()Ljava/lang/String;
      ASTORE 3
    

    可以看到编译器new了一个 StringBuilder对象,然后调用了2次append方法进行字符串的拼接。也就是说+号拼接String 只是Java语言的语法糖而已,就跟上一篇说的自动装箱和拆箱一个意思。

    测试一下编译器的智商

    既然编译器会帮我们将String + 号拼接转化为StringBuilder拼接,那我们就用一段代码来测试一下它的智商到底怎么样。

    String result = "";
    for (int i = 0; i < 10; i++) {
       String a = "Hello";
       result += a;
    }
    

    同样很简单,我们来看字节码

    L0
      LINENUMBER 18 L0
      LDC ""
      ASTORE 1
    L1
      LINENUMBER 19 L1
      ICONST_0
      ISTORE 2
    L2
      FRAME APPEND [java/lang/String I]
      ILOAD 2
      BIPUSH 10
      IF_ICMPGE L3
    L4
      LINENUMBER 20 L4
      LDC "Hello"
      ASTORE 3
    L5
      LINENUMBER 21 L5
      NEW java/lang/StringBuilder
      DUP
      INVOKESPECIAL java/lang/StringBuilder.<init> ()V
      ALOAD 1
      INVOKEVIRTUAL java/lang/StringBuilder.append (Ljava/lang/String;)Ljava/lang/StringBuilder;
      ALOAD 3
      INVOKEVIRTUAL java/lang/StringBuilder.append (Ljava/lang/String;)Ljava/lang/StringBuilder;
      INVOKEVIRTUAL java/lang/StringBuilder.toString ()Ljava/lang/String;
      ASTORE 1
    L6
      LINENUMBER 19 L6
      IINC 2 1
      GOTO L2
    

    可以看到StringBuilder的创建是在循环体内创建的,所以会多次创建多个对象,效率很低,所以编译器没有那么智能,了解了这个,以后项目中需要循环拼接字符串时,避免直接使用+拼接。

    字符串 + 还另有玄机

    直接看下面的代码

    final String a = "hello";
    final String b = "world";
    String result = a + b;
    

    没看出来什么特别的!!!到底玄机在哪,直接看字节码

    L0
      LINENUMBER 19 L0
      LDC "hello"
      ASTORE 1
    L1
      LINENUMBER 20 L1
      LDC "world"
      ASTORE 2
    L2
      LINENUMBER 21 L2
      LDC "helloworld"
      ASTORE 3
    

    额,编译器直接帮我们把a+b拼接了,因为a和b都是final类型的,在编译期值也是确定的,所以编译器帮我们做了这个优化。这一块的知识,就不展开的特别多的去分析了,目前我们得到的结论就是如果字符串拼接的双方都是 final 类型的常量字符串,编译器就会帮我们直接进行优化。

    字符串常量池的故事

    Java的设计者为了提高Java的运行效率,有很多精心的设计,字符串常量池就是其中之一(String Constant Pool),我们后面都简称为SCP。还是先看一段代码(面试题中经常见)

    final String a = "hello";
    final String b = "hello";
    final String c = new String("hello");
    final String d = c.intern();
    
    System.out.println("a==b:" + (a == b));
    System.out.println("a==c:" + (a == c));
    System.out.println("a==d:" + (a == d));
    

    运行结果如下:

    • a==b:true (a和b都存在于SCP中,所以它们是一个对象)
    • a==c:false (new的对象存在于堆中,所以c和a不是一个对象)
    • a==d:true (intern方法将字符串放入SCP中,并返回,所以a和d是一个对象)

    SCP确实可以一定程度减少对象的重复创建,但是我们再想一种情形,如果我们改变了a字符串的值,我们肯定不希望b跟着变,但是a和b又指向同一个对象,很可能a 的修改会产生我们不愿意看到的结果。其实是没有问题的,因为Java中String是被设计成不可变的,如果要变就会重新生成一个新的对象,不会影响旧的对象,这也是SCP能够正常工作的前提。

    SCP的前世今生

    SCP在JDK6 之前是被设计在 永久代中的,并且不会进行垃圾回收,默认大小64M(可以通过-XX:MaxPermSize进行设置),所以如果在循环中,不断创建常量字符串放入SCP中,会导致OOM。JDK7开始,SCP被设计在堆中,这样它的大小限制被大大的放开了,而且会进行垃圾回收,Java也在不断的优化进步😆。

    最后:我自己的一点点小思考

    为什么Java的设计者将String要被设计成immutable???
    我想可能有以下2个原因

    • 为了SCP的优化
    • 线程安全

    设计没有完美的,有得必有失,immutable导致String的扩展被限制,所以Java提供了StringBuilder和StringBuffer二个类来帮助我们进行字符串操作。

    以上

    相关文章

      网友评论

      本文标题:关于String你还需要知道这些细节

      本文链接:https://www.haomeiwen.com/subject/cgxemftx.html