美文网首页深入理解Java基础Java 杂谈
【Java基本功】一文读懂String及其包装类的实现原理

【Java基本功】一文读懂String及其包装类的实现原理

作者: 程序员黄小斜 | 来源:发表于2019-01-07 18:42 被阅读32次

    String作为Java中最常用的引用类型,相对来说基本上都比较熟悉,无论在平时的编码过程中还是在笔试面试中,String都很受到青睐,然而,在使用String过程中,又有较多需要注意的细节之处。


    String的连接

    1. @Test

    2. publicvoid contact () {

    3.    //1连接方式

    4.    String s1 = "a";

    5.    String s2 = "a";

    6.    String s3 = "a" + s2;

    7.    String s4 = "a" + "a";

    8.    String s5 = s1 + s2;

    9.    //表达式只有常量时,编译期完成计算

    10.    //表达式有变量时,运行期才计算,所以地址不一样

    11.    System.out.println(s3 == s4); //f

    12.    System.out.println(s3 == s5); //f

    13.    System.out.println(s4 == "aa"); //t

    14. }

    String类型的intern

    1. publicvoid intern () {

    2.    //2:string的intern使用

    3.    //s1是基本类型,比较值。s2是string实例,比较实例地址

    4.    //字符串类型用equals方法比较时只会比较值

    5.    String s1 = "a";

    6.    String s2 = newString("a");

    7.    //调用intern时,如果s2中的字符不在常量池,则加入常量池并返回常量的引用

    8.    String s3 = s2.intern();

    9.    System.out.println(s1 == s2);

    10.    System.out.println(s1 == s3);

    11. }

    String类型的equals

    1. //字符串的equals方法

    2. //    public boolean equals(Object anObject) {

    3. //            if (this == anObject) {

    4. //                return true;

    5. //            }

    6. //            if (anObject instanceof String) {

    7. //                String anotherString = (String)anObject;

    8. //                int n = value.length;

    9. //                if (n == anotherString.value.length) {

    10. //                    char v1[] = value;

    11. //                    char v2[] = anotherString.value;

    12. //                    int i = 0;

    13. //                    while (n-- != 0) {

    14. //                        if (v1[i] != v2[i])

    15. //                            return false;

    16. //                        i++;

    17. //                    }

    18. //                    return true;

    19. //                }

    20. //            }

    21. //            return false;

    22. //        }

    StringBuffer和Stringbuilder

    底层是继承父类的可变字符数组value

    1. /**

    2. * The value is used for character storage.

    3. */

    4. char[] value;

    5. 初始化容量为16

    6. /**

    7. * Constructs a string builder with no characters in it and an

    8. * initial capacity of 16 characters.

    9. */

    10. publicStringBuilder() {

    11.    super(16);

    12. }

    13. 这两个类的append方法都是来自父类AbstractStringBuilder的方法

    14. publicAbstractStringBuilder append(String str) {

    15.    if (str == null)

    16.        return appendNull();

    17.    int len = str.length();

    18.    ensureCapacityInternal(count + len);

    19.    str.getChars(0, len, value, count);

    20.    count += len;

    21.    returnthis;

    22. }

    23. @Override

    24. publicStringBuilder append(String str) {

    25.    super.append(str);

    26.    returnthis;

    27. }

    28. @Override

    29. publicsynchronizedStringBuffer append(String str) {

    30.    toStringCache = null;

    31.    super.append(str);

    32.    returnthis;

    33. }

    append

    1. Stringbuffer在大部分涉及字符串修改的操作上加了synchronized关键字来保证线程安全,效率较低。

    2. String类型在使用 + 运算符例如

    3. String a = "a"

    4. a = a + a;时,实际上先把a封装成stringbuilder,调用append方法后再用tostring返回,所以当大量使用字符串加法时,会大量地生成stringbuilder实例,这是十分浪费的,这种时候应该用stringbuilder来代替string

    扩容

    1. #注意在append方法中调用到了一个函数

    2. ensureCapacityInternal(count + len);

    3. 该方法是计算append之后的空间是否足够,不足的话需要进行扩容

    4. publicvoid ensureCapacity(int minimumCapacity) {

    5.    if (minimumCapacity > 0)

    6.        ensureCapacityInternal(minimumCapacity);

    7. }

    8. privatevoid ensureCapacityInternal(int minimumCapacity) {

    9.    // overflow-conscious code

    10.    if (minimumCapacity - value.length > 0) {

    11.        value = Arrays.copyOf(value,

    12.                newCapacity(minimumCapacity));

    13.    }

    14. }

    15. 如果新字符串长度大于value数组长度则进行扩容

    16. 扩容后的长度一般为原来的两倍 + 2

    17. 假如扩容后的长度超过了jvm支持的最大数组长度MAX_ARRAY_SIZE。

    18. 考虑两种情况

    19. 如果新的字符串长度超过int最大值,则抛出异常,否则直接使用数组最大长度作为新数组的长度。

    20. privateint hugeCapacity(int minCapacity) {

    21.    if (Integer.MAX_VALUE - minCapacity < 0) { // overflow

    22.        thrownewOutOfMemoryError();

    23.    }

    24.    return (minCapacity > MAX_ARRAY_SIZE)

    25.        ? minCapacity : MAX_ARRAY_SIZE;

    26. }

    删除

    1. 这两个类型的删除操作:

    2. 都是调用父类的delete方法进行删除

    3. publicAbstractStringBuilderdelete(int start, intend) {

    4.    if (start < 0)

    5.        thrownewStringIndexOutOfBoundsException(start);

    6.    if (end > count)

    7.        end = count;

    8.    if (start > end)

    9.        thrownewStringIndexOutOfBoundsException();

    10.    int len = end - start;

    11.    if (len > 0) {

    12.        System.arraycopy(value, start+len, value, start, count-end);

    13.        count -= len;

    14.    }

    15.    returnthis;

    16. }

    17. 事实上是将剩余的字符重新拷贝到字符数组value。

    这里用到了system.arraycopy来拷贝数组,速度是比较快的

    system.arraycopy方法

    1. 转自知乎:

    2. 在主流高性能的JVM上(HotSpot VM系、IBM J9 VM系、JRockit系等等),可以认为System.arraycopy()在拷贝数组时是可靠高效的——如果发现不够高效的情况,请报告performance bug,肯定很快就会得到改进。

    3. java.lang.System.arraycopy()方法在Java代码里声明为一个native方法。所以最naïve的实现方式就是通过JNI调用JVM里的native代码来实现。

    String的不可变性

    关于String的不可变性,这里转一个不错的回答

    什么是不可变?

    String不可变很简单,如下图,给一个已有字符串"abcd"第二次赋值成"abcedl",不是在原内存地址上修改数据,而是重新指向一个新对象,新地址。

    String为什么不可变?

    翻开JDK源码,java.lang.String类起手前三行,是这样写的:

    1. publicfinalclassStringimplements java.io.Serializable, Comparable<String>, CharSequence {  

    2.  /** String本质是个char数组. 而且用final关键字修饰.*/    

    3. privatefinalchar value[];  ...  ...

    4. }

    首先String类是用final关键字修饰,这说明String不可继承。再看下面,String类的主力成员字段value是个char[]数组,而且是用final修饰的。

    final修饰的字段创建以后就不可改变。 有的人以为故事就这样完了,其实没有。因为虽然value是不可变,也只是value这个引用地址不可变。挡不住Array数组是可变的事实。

    Array的数据结构看下图。

    也就是说Array变量只是stack上的一个引用,数组的本体结构在heap堆。

    String类里的value用final修饰,只是说stack里的这个叫value的引用地址不可变。没有说堆里array本身数据不可变。看下面这个例子,

    1. finalint[] value={1,2,3} ;

    2. int[] another={4,5,6};

    3. value=another;    //编译器报错,final不可变 value用final修饰,编译器不允许我把value指向堆区另一个地址。

    4. 但如果我直接对数组元素动手,分分钟搞定。

    5. finalint[] value={1,2,3};

    6. value[2]=100;  //这时候数组里已经是{1,2,100}   所以String是不可变,关键是因为SUN公司的工程师。

    7. 在后面所有String的方法里很小心的没有去动Array里的元素,没有暴露内部成员字段。

    8. privatefinalchar value[]这一句里,private的私有访问权限的作用都比final大。而且设计师还很小心地把整个String设成final禁止继承,避免被其他人继承后破坏。所以String是不可变的关键都在底层的实现,而不是一个final。考验的是工程师构造数据类型,封装数据的功力。

    不可变有什么好处?

    这个最简单地原因,就是为了安全。看下面这个场景(有评论反应例子不够清楚,现在完整地写出来),一个函数appendStr( )在不可变的String参数后面加上一段“bbb”后返回。appendSb( )负责在可变的StringBuilder后面加“bbb”。

    总结以下String的不可变性。

    1 首先final修饰的类只保证不能被继承,并且该类的对象在堆内存中的地址不会被改变。

    2 但是持有String对象的引用本身是可以改变的,比如他可以指向其他的对象。

    3 final修饰的char数组保证了char数组的引用不可变。但是可以通过char[0] = 'a'来修改值。不过String内部并不提供方法来完成这一操作,所以String的不可变也是基于代码封装和访问控制的。

    举个例子

    1. finalclassFi {

    2.    int a;

    3.    finalint b = 0;

    4.    Integer s;

    5. }

    6. finalchar[]a = {'a'};

    7. finalint[]b = {1};

    8. @Test

    9. publicvoidfinal修饰类() {

    10.    //引用没有被final修饰,所以是可变的。

    11.    //final只修饰了Fi类型,即Fi实例化的对象在堆中内存地址是不可变的。

    12.    //虽然内存地址不可变,但是可以对内部的数据做改变。

    13.    Fi f = newFi();

    14.    f.a = 1;

    15.    System.out.println(f);

    16.    f.a = 2;

    17.    System.out.println(f);

    18.    //改变实例中的值并不改变内存地址。

    19.    Fi ff = f;

    20.    //让引用指向新的Fi对象,原来的f对象由新的引用ff持有。

    21.    //引用的指向改变也不会改变原来对象的地址

    22.    f = newFi();

    23.    System.out.println(f);

    24.    System.out.println(ff);

    25. }

    26. 这里的对f.a的修改可以理解为char[0] = 'a'这样的操作。只改变数据值,不改变内存值。

    要理解String里的intern方法,就要注意基本数据类型的拆箱装箱,以及对常量池的理解。


    常量池和自动拆箱装箱

    1. 自动拆箱和装箱的原理其实与常量池有关。

    2. 3.1存在栈中:

    3. publicvoid(int a)

    4. {

    5. int i = 1;

    6. int j = 1;

    7. }

    8. 方法中的i 存在虚拟机栈的局部变量表里,i是一个引用,j也是一个引用,它们都指向局部变量表里的整型值 1.

    9. int a是传值引用,所以a也会存在局部变量表。


    10. 3.2存在堆里:

    11. class A{

    12. int i = 1;

    13. A a = new A();

    14. }

    15. i是类的成员变量。类实例化的对象存在堆中,所以成员变量也存在堆中,引用a存的是对象的地址,引用i存的是值,这个值1也会存在堆中。可以理解为引用i指向了这个值1。也可以理解为i就是1.

    16. 3.3包装类对象怎么存

    17. 其实我们说的常量池也可以叫对象池。

    18. 比如String a= newString("a").intern()时会先在常量池找是否有“a"对象如果有的话直接返回“a"对象在常量池的地址,即让引用a指向常量”a"对象的内存地址。

    19. public native String intern();

    20. Integer也是同理。

    下图是Integer类型在常量池中查找同值对象的方法。

    1. publicstaticInteger valueOf(int i) {

    2.    if (i >= IntegerCache.low && i <= IntegerCache.high)

    3.        returnIntegerCache.cache[i + (-IntegerCache.low)];

    4.    returnnewInteger(i);

    5. }

    6. privatestaticclassIntegerCache {

    7.    staticfinalint low = -128;

    8.    staticfinalint high;

    9.    staticfinalInteger cache[];

    10.    static {

    11.        // high value may be configured by property

    12.        int h = 127;

    13.        String integerCacheHighPropValue =

    14.            sun.misc.VM.getSavedProperty("java.lang.Integer.IntegerCache.high");

    15.        if (integerCacheHighPropValue != null) {

    16.            try {

    17.                int i = parseInt(integerCacheHighPropValue);

    18.                i = Math.max(i, 127);

    19.                // Maximum array size is Integer.MAX_VALUE

    20.                h = Math.min(i, Integer.MAX_VALUE - (-low) -1);

    21.            } catch( NumberFormatException nfe) {

    22.                // If the property cannot be parsed into an int, ignore it.

    23.            }

    24.        }

    25.        high = h;

    26.        cache = newInteger[(high - low) + 1];

    27.        int j = low;

    28.        for(int k = 0; k < cache.length; k++)

    29.            cache[k] = newInteger(j++);

    30.        // range [-128, 127] must be interned (JLS7 5.1.7)

    31.        assertIntegerCache.high >= 127;

    32.    }

    33.    privateIntegerCache() {}

    34. }

    所以基本数据类型的包装类型可以在常量池查找对应值的对象,找不到就会自动在常量池创建该值的对象。

    而String类型可以通过intern来完成这个操作。

    JDK1.7后,常量池被放入到堆空间中,这导致intern()函数的功能不同,具体怎么个不同法,且看看下面代码,这个例子是网上流传较广的一个例子,分析图也是直接粘贴过来的,这里我会用自己的理解去解释这个例子:

    1. [java] view plain copy

    2. String s = newString("1");  

    3. s.intern();  

    4. String s2 = "1";  

    5. System.out.println(s == s2);  

    6. String s3 = newString("1") + newString("1");  

    7. s3.intern();  

    8. String s4 = "11";  

    9. System.out.println(s3 == s4);  

    10. 输出结果为:

    11. [java] view plain copy

    12. JDK1.6以及以下:falsefalse  

    13. JDK1.7以及以上:falsetrue

    JDK1.6查找到常量池存在相同值的对象时会直接返回该对象的地址。

    JDK 1.7后,intern方法还是会先去查询常量池中是否有已经存在,如果存在,则返回常量池中的引用,这一点与之前没有区别,区别在于,如果在常量池找不到对应的字符串,则不会再将字符串拷贝到常量池,而只是在常量池中生成一个对原字符串的引用。

    那么其他字符串在常量池找值时就会返回另一个堆中对象的地址。

    相关文章

      网友评论

        本文标题:【Java基本功】一文读懂String及其包装类的实现原理

        本文链接:https://www.haomeiwen.com/subject/hvlprqtx.html