Integer三个toString()

作者: cosfun | 来源:发表于2020-02-25 17:35 被阅读0次

Integer三个toString()
Integer源码分析
Integer源码（toString）解析
getText()相关
java基本类型(Date 日期等)
探索Integer番外篇之Integer.getChars(in
js中toString()、valueOf()浅析
kotlin inheritance 继承
3..toString() ，多个点问题
Object类中常见的方法

在Integer源码中有三个toString()方法

    1、public String toString() 
    2、public static String toString(int i)
    3、public static String toString(int i, int radix)

其中1继承至object类，
完整代码为：

    public String toString() {
        return toString(value);
    }

在return会进入第2个toString方法，源码为

    public static String toString(int i) {
        if (i == Integer.MIN_VALUE)
            return "-2147483648";
        int size = (i < 0) ? stringSize(-i) + 1 : stringSize(i);
        char[] buf = new char[size];
        getChars(i, size, buf);
        return new String(buf, true);
    }

可以看到判断

    public static final int   MIN_VALUE = 0x80000000;

    if (i == Integer.MIN_VALUE)
            return "-2147483648";

16进制的MIN_VALUE换算成10进制等于2147483648，可为什么当i==2147483648时，返回的字符串要加上负数呢？

这是因为Integer在计算机中用4个字节表示，每个字节8位，即：

00000000 00000000 00000000 00000000

其中正数范围为1~2^31，因为第一位用来表示正负符号，所以只有31位
同理负数也为1~2^31，
那么会多出两个码

00000000 00000000 00000000 00000000
10000000 00000000 00000000 00000000

其中第一个表示为0，第二个表示为-2147483648（这跟原码补码反码的知识有关，这也是Integer取值范围为-2^31 ~2^31-1的原因，负数比正数多一个值）

继续源码

        int size = (i < 0) ? stringSize(-i) + 1 : stringSize(i);
        char[] buf = new char[size];
        getChars(i, size, buf);
        return new String(buf, true);

其中stringsize源码为：

    final static int [] sizeTable = { 9, 99, 999, 9999, 99999, 999999, 9999999,
                                      99999999, 999999999, Integer.MAX_VALUE };

    static int stringSize(int x) {
        for (int i=0; ; i++)
            if (x <= sizeTable[i])
                return i+1;
    }

它会返回参数x的位数，比如20（2位）返回2，340（3位）返回3

int size = (i < 0) ? stringSize(-i) + 1 : stringSize(i);

那么size的意图也很明显了，如果负数先转为正数，求值后+1因为要存放负号"-"

接下来进入getchar

      int charPos = index;
      while (i >= 65536) {
            q = i / 100;
        // really: r = i - (q * 100);
            r = i - ((q << 6) + (q << 5) + (q << 2));
            i = q;
            buf [--charPos] = DigitOnes[r];
            buf [--charPos] = DigitTens[r];
        }

当输入的i大于65535时会先执行这么一段方法，
举例输入为765432，则charPos=6（位数），q为7654，q << 6 则是把q放大2^6倍
((q << 6) + (q << 5) + (q << 2))即为放大q为64+32+4=100倍
则此时r=32，i等于7654
DigitOnes和DigitTens是两个设计巧妙的数组

final static char [] DigitTens = {
        '0', '0', '0', '0', '0', '0', '0', '0', '0', '0',
        '1', '1', '1', '1', '1', '1', '1', '1', '1', '1',
        '2', '2', '2', '2', '2', '2', '2', '2', '2', '2',
        '3', '3', '3', '3', '3', '3', '3', '3', '3', '3',
        '4', '4', '4', '4', '4', '4', '4', '4', '4', '4',
        '5', '5', '5', '5', '5', '5', '5', '5', '5', '5',
        '6', '6', '6', '6', '6', '6', '6', '6', '6', '6',
        '7', '7', '7', '7', '7', '7', '7', '7', '7', '7',
        '8', '8', '8', '8', '8', '8', '8', '8', '8', '8',
        '9', '9', '9', '9', '9', '9', '9', '9', '9', '9',
        } ;

    final static char [] DigitOnes = {
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        '0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
        } ;

它会把r的个位和十位取出来
此时buf 的值为：

[0，0，0，0，3，2]

接下来则继续执行

        for (;;) {
            q = (i * 52429) >>> (16+3);
            r = i - ((q << 3) + (q << 1));  // r = i-(q*10) ...
            buf [--charPos] = digits [r];
            i = q;
            if (i == 0) break;
        }

其中2^19=524288, 52429/524288=0.1000003814697265
也就是q = i/10的意思，此时i为7654，则q为765
为什么不直接写i/10而要拐外抹角写这么复杂呢？这是因为乘和位移的效率在计算机运算中要比除高效，而为什么位移19位是因为19是在Interger范围内精度最接近0.1的。
类似的可以看

2^18=262144, 26215/262144  =0.10000228881835938
2^19=524288, 52429/524288  =0.1000003814697265
2^20=262144, 104858/1048576=0.1000003814697265

继续源码，r则会取出个位上的数，反复循环如此得到buf数组

r = i - ((q << 3) + (q << 1));  // r = i-(q*10) ...

最后调用return new String(buf, true)，即完成了第二个toString方法

接下来我们看第三个toString方法

public static String toString(int i, int radix)

第三个toString支持进制转换，限制为MIN_RADIX=2,MAX_RADIX=36

if (radix < Character.MIN_RADIX || radix > Character.MAX_RADIX)
            radix = 10;

MIN_RADIX=2很好理解，当进制为1时没有意义，
MAX_RADIX为36则是因为数字加上26个字母一共36个，实际上可以用大写字母继续扩充，这里理解为jdk只支持到36位

final static char[] digits = {
        '0' , '1' , '2' , '3' , '4' , '5' ,
        '6' , '7' , '8' , '9' , 'a' , 'b' ,
        'c' , 'd' , 'e' , 'f' , 'g' , 'h' ,
        'i' , 'j' , 'k' , 'l' , 'm' , 'n' ,
        'o' , 'p' , 'q' , 'r' , 's' , 't' ,
        'u' , 'v' , 'w' , 'x' , 'y' , 'z'
    };

当radix为10时，直接调用第二个toString方法

        /* Use the faster version */
        if (radix == 10) {
            return toString(i);
        }

接下来源码：

        char buf[] = new char[33];
        boolean negative = (i < 0);
        int charPos = 32;

        if (!negative) {
            i = -i;
        }

        while (i <= -radix) {
            buf[charPos--] = digits[-(i % radix)];
            i = i / radix;
        }
        buf[charPos] = digits[-i];

        if (negative) {
            buf[--charPos] = '-';
        }

我们可以知道Integer的2进制一共4*8-1为31位，算上符号也只用32位，为什么new char[33]需要33位呢？这是因为我们上面说的特殊补码

10000000000000000000000000000000

它表示的是-2147483648，而2147483648占用了32位，加上符号一共就需要32位了。

       if (!negative) {
            i = -i;
        }

这里将i统一转换成负数处理，与第二个toString不同，第二个toString是统一转换成正数处理。这里我认为统一转换成正数也可以，后续就是普通的进制转换算法。
至此，3个toString方法就全部说完了。

网友评论

JDK源码分析

本文标题：Integer三个toString()

本文链接：https://www.haomeiwen.com/subject/lyjtchtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Integer三个toString()

16进制的MIN_VALUE换算成10进制等于2147483648，可为什么当i==2147483648时，返回的字符串要加上负数呢？

相关文章