美文网首页JDK源码分析
Integer三个toString()

Integer三个toString()

作者: cosfun | 来源:发表于2020-02-25 17:35 被阅读0次

在Integer源码中有三个toString()方法

    1、public String toString() 
    2、public static String toString(int i)
    3、public static String toString(int i, int radix)

其中1继承至object类,
完整代码为:

    public String toString() {
        return toString(value);
    }

在return会进入第2个toString方法,源码为

    public static String toString(int i) {
        if (i == Integer.MIN_VALUE)
            return "-2147483648";
        int size = (i < 0) ? stringSize(-i) + 1 : stringSize(i);
        char[] buf = new char[size];
        getChars(i, size, buf);
        return new String(buf, true);
    }

可以看到判断

    public static final int   MIN_VALUE = 0x80000000;

    if (i == Integer.MIN_VALUE)
            return "-2147483648";
16进制的MIN_VALUE换算成10进制等于2147483648,可为什么当i==2147483648时,返回的字符串要加上负数呢?

这是因为Integer在计算机中用4个字节表示,每个字节8位,即:

00000000 00000000 00000000 00000000

其中正数范围为1~2^31,因为第一位用来表示正负符号,所以只有31位
同理负数也为1~2^31,
那么会多出两个码

00000000 00000000 00000000 00000000
10000000 00000000 00000000 00000000

其中第一个表示为0,第二个表示为-2147483648(这跟原码补码反码的知识有关,这也是Integer取值范围为-2^31 ~2^31-1的原因,负数比正数多一个值)

继续源码

        int size = (i < 0) ? stringSize(-i) + 1 : stringSize(i);
        char[] buf = new char[size];
        getChars(i, size, buf);
        return new String(buf, true);

其中stringsize源码为:

    final static int [] sizeTable = { 9, 99, 999, 9999, 99999, 999999, 9999999,
                                      99999999, 999999999, Integer.MAX_VALUE };

    static int stringSize(int x) {
        for (int i=0; ; i++)
            if (x <= sizeTable[i])
                return i+1;
    }

它会返回参数x的位数,比如20(2位)返回2,340(3位)返回3

int size = (i < 0) ? stringSize(-i) + 1 : stringSize(i);

那么size的意图也很明显了,如果负数先转为正数,求值后+1因为要存放负号"-"

接下来进入getchar

      int charPos = index;
      while (i >= 65536) {
            q = i / 100;
        // really: r = i - (q * 100);
            r = i - ((q << 6) + (q << 5) + (q << 2));
            i = q;
            buf [--charPos] = DigitOnes[r];
            buf [--charPos] = DigitTens[r];
        }

当输入的i大于65535时会先执行这么一段方法,
举例输入为765432,则charPos=6(位数),q为7654,q << 6 则是把q放大2^6倍
((q << 6) + (q << 5) + (q << 2))即为放大q为64+32+4=100倍
则此时r=32,i等于7654
DigitOnes和DigitTens是两个设计巧妙的数组

final static char [] DigitTens = {
        '0', '0', '0', '0', '0', '0', '0', '0', '0', '0',
        '1', '1', '1', '1', '1', '1', '1', '1', '1', '1',
        '2', '2', '2', '2', '2', '2', '2', '2', '2', '2',
        '3', '3', '3', '3', '3', '3', '3', '3', '3', '3',
        '4', '4', '4', '4', '4', '4', '4', '4', '4', '4',
        '5', '5', '5', '5', '5', '5', '5', '5', '5', '5',
        '6', '6', '6', '6', '6', '6', '6', '6', '6', '6',
        '7', '7', '7', '7', '7', '7', '7', '7', '7', '7',
        '8', '8', '8', '8', '8', '8', '8', '8', '8', '8',
        '9', '9', '9', '9', '9', '9', '9', '9', '9', '9',
        } ;

    final static char [] DigitOnes = {
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        } ;

它会把r的个位和十位取出来
此时buf 的值为:

[0,0,0,0,3,2] 

接下来则继续执行

        for (;;) {
            q = (i * 52429) >>> (16+3);
            r = i - ((q << 3) + (q << 1));  // r = i-(q*10) ...
            buf [--charPos] = digits [r];
            i = q;
            if (i == 0) break;
        }

其中2^19=524288, 52429/524288=0.1000003814697265
也就是q = i/10的意思,此时i为7654,则q为765
为什么不直接写i/10而要拐外抹角写这么复杂呢?这是因为乘和位移的效率在计算机运算中要比除高效,而为什么位移19位是因为19是在Interger范围内精度最接近0.1的。
类似的可以看

2^18=262144, 26215/262144  =0.10000228881835938
2^19=524288, 52429/524288  =0.1000003814697265
2^20=262144, 104858/1048576=0.1000003814697265

继续源码,r则会取出个位上的数,反复循环如此得到buf数组

r = i - ((q << 3) + (q << 1));  // r = i-(q*10) ...

最后调用return new String(buf, true),即完成了第二个toString方法

接下来我们看第三个toString方法

public static String toString(int i, int radix)

第三个toString支持进制转换,限制为MIN_RADIX=2,MAX_RADIX=36

if (radix < Character.MIN_RADIX || radix > Character.MAX_RADIX)
            radix = 10;

MIN_RADIX=2很好理解,当进制为1时没有意义,
MAX_RADIX为36则是因为数字加上26个字母一共36个,实际上可以用大写字母继续扩充,这里理解为jdk只支持到36位

final static char[] digits = {
        '0' , '1' , '2' , '3' , '4' , '5' ,
        '6' , '7' , '8' , '9' , 'a' , 'b' ,
        'c' , 'd' , 'e' , 'f' , 'g' , 'h' ,
        'i' , 'j' , 'k' , 'l' , 'm' , 'n' ,
        'o' , 'p' , 'q' , 'r' , 's' , 't' ,
        'u' , 'v' , 'w' , 'x' , 'y' , 'z'
    };

当radix为10时,直接调用第二个toString方法

        /* Use the faster version */
        if (radix == 10) {
            return toString(i);
        }

接下来源码:

        char buf[] = new char[33];
        boolean negative = (i < 0);
        int charPos = 32;

        if (!negative) {
            i = -i;
        }

        while (i <= -radix) {
            buf[charPos--] = digits[-(i % radix)];
            i = i / radix;
        }
        buf[charPos] = digits[-i];

        if (negative) {
            buf[--charPos] = '-';
        }

我们可以知道Integer的2进制一共4*8-1为31位,算上符号也只用32位,为什么new char[33]需要33位呢?这是因为我们上面说的特殊补码

10000000000000000000000000000000

它表示的是-2147483648,而2147483648占用了32位,加上符号一共就需要32位了。

       if (!negative) {
            i = -i;
        }

这里将i统一转换成负数处理,与第二个toString不同,第二个toString是统一转换成正数处理。这里我认为统一转换成正数也可以,后续就是普通的进制转换算法。
至此,3个toString方法就全部说完了。

相关文章

网友评论

    本文标题:Integer三个toString()

    本文链接:https://www.haomeiwen.com/subject/lyjtchtx.html