java.lang.Integer源码精读(一)

作者: 李不言被占用了 | 来源:发表于2018-08-22 10:25 被阅读10次

java.lang.Integer源码精读(一)
java.lang.Integer源码精读(二)
java.lang.Integer源码分析
java.lang.Integer源码分析
java.lang.Integer线程安全吗？
8. String to Integer (atoi)
精读《sqorn 源码》
精读LinkedList源码
Javadoc归类
【比特币源码精读一】

JDK源码精读汇总帖

类声明

public final class Integer extends Number implements Comparable<Integer> {}

public abstract class Number implements java.io.Serializable {}

抽象类 Number 是 BigDecimal、BigInteger、Byte、Double、Float、Integer、Long 和 Short 类的超类。
Number 的子类必须提供将表示的数值转换为 byte、double、float、int、long 和 short 的方法。
Integer中对应的方法就是类型转换，将int转换成byte、double、float、long 和 short 类型。

compareTo

实现了Comparable，看看对应的方法，很好理解

public int compareTo(Integer anotherInteger) {
    return compare(this.value, anotherInteger.value);
}

/**
 * jdk1.7之后单独抽取出来的static方法，可以作为工具方法用于比较两个整数
 */
public static int compare(int x, int y) {
    return (x < y) ? -1 : ((x == y) ? 0 : 1);
}

toString(int)

看看非常常用的toString方法

public static String toString(int i) {
    // 如果是Integer的最小值，直接返回字符串"-2147483648"
    if (i == Integer.MIN_VALUE)
        return "-2147483648";
    // 计算形参i的位数，负数的话，size要比数字本身多1，用来存储负号(-)
    int size = (i < 0) ? stringSize(-i) + 1 : stringSize(i);
    // 构造一个用于存储数字的字符数组
    char[] buf = new char[size];
    // 填充字符数组
    getChars(i, size, buf);
    return new String(buf, true);
}

先看看stringSize方法，这个方法返回的是形参i的位数

final static int [] sizeTable = { 9, 99, 999, 9999, 99999, 999999, 9999999, 99999999, 999999999, Integer.MAX_VALUE };

// 要求形参x为正数
static int stringSize(int x) {
    // 一个个和sizeTable比较，到第i个数代表x由(i+1)个数字组成
    for (int i=0; ; i++)
        if (x <= sizeTable[i])
            return i+1;
}

再看看getChars方法，这个方法就是将组成形成i的每一个数字，填充到buf数组里。在看getChars这个方法之前可以先思考一下，怎么样获取形参i的每个位置上的数字呢？其实就是循环：①每次除以10求余(%)，得到的就是个位上的数字；②然后再将形参i除以10，整数相除，尾数(即前面的余数)就会被丢弃；③重复①②直到形参i变成0。如12，第一次循环：除以10求余得到2，就是个位数上的数字是2，然后除以10，得到1，个位数上的2就被丢弃了，第二次循环：除10求余得到1，然后除以10得到0，于是分别得到了2和1，循环结束了。用代码来看的话就是：

while (true) {
    r = i % 10;
    i /= 10;
    // 伪代码↓
    // 第n次循环，将r加入到buf的倒数第n位上
    if (i == 0) break;

以上只考虑了正数的情况，对于负数的情况，只要再循环结束后，在buf的第0个位置加上一个'-'即可，完整代码如下：

static void myGetChars(int i, int index, char[] buf) {
    int charPos = index;// 用来记录buf每次可插入的尾部
    char sign = 0;// 是否为负数的标记
    if (i < 0) {
        sign = '-';
        i = -i;// 当成正数处理
    }        
    while (true) {
        int r = i % 10;
        i /= 10;
        buf [--charPos] = digits [r];// 将数字r转成字符'r'，然后添加到buf的可插入尾部
        if (i == 0) break;
    }
    if (sign != 0) {
        buf [--charPos] = sign;
    }
}

看样子好像实现了getChars的功能，但是jdk里面是不是这么做的呢？答案是：no!看看源码：

static void getChars(int i, int index, char[] buf) {
    int q, r;// r为余数，就是每次被插入到buf的数
    int charPos = index;// buf可插入尾部
    char sign = 0;

    if (i < 0) {
        sign = '-';
        i = -i;
    }

    // i >= 65536时
    // 每次迭代向buf插入2个数字，即i的最后两位，目的应该是加快迭代速度
    while (i >= 65536) {
        q = i / 100;
        // really: r = i - (q * 100);
        // 本质就是r = i - (q * 100)
        // q << 6 = 2^6 = 64
        // q << 5 = 2^5 = 32
        // q << 2 = 2^2 = 4
        // i - q * 100 得到的r就是i的末尾2位数，本质是i%100，应该是乘法运算速度大于除法，大于求余，但是减法的速度应该也不算快
        r = i - ((q << 6) + (q << 5) + (q << 2));
        i = q;
        // 插入r的个位数
        buf [--charPos] = DigitOnes[r];
        // 插入r的十位数
        buf [--charPos] = DigitTens[r];
    }

    // Fall thru to fast mode for smaller numbers
    // assert(i <= 65536, i);
    for (;;) {
        // 这里本质就是i/10，
        q = (i * 52429) >>> (16+3);
        r = i - ((q << 3) + (q << 1));  // 本质就是 r = i-(q*10)
        buf [--charPos] = digits [r];// 将数字r转成字符'r'，然后添加到buf的可插入尾部
        i = q;
        if (i == 0) break;
    }
    if (sign != 0) {// 如果是负数，再插入'-'
        buf [--charPos] = sign;
    }
}

这里有几个比较有意思的地方：

首先是分段来获取字符，分成>=65535和<65535两段，大于等于65535的部分，每次迭代获取两个字符，这里有个疑问的地方是，为什么不分成>=10和<10两部分呢，难道是后面这一小段代码的执行速度比较快？
其次是<65535这部分，对于q = (i * 52429) >>> (16+3);,这个代码等价于q = i / 10;，应该是ALU执行乘法和移位运算的速度快过除法的运算速度。但是为什么是52429和2^19 (2的19次方，无符号右移19位相当于除以2的19次方)，这是出于精度同时不会溢出这两方面考虑的。首先说精度方面，(double)52429/524288=0.100000381469，这个精度完全可以保证求出i的十分之一，比如选了一个精度不够的，求出值为0.103，那么如果i是999，999*0.103=102,并不是999的十分之一99；另外一方面，65536=2^16，52429<65536，所以i * 52429 < 2^32，不会溢出，至于i * 52429 会导致结果变成负数的问题，这只是中间结果，无符号右移19位之后，高位全部补0，结果q还是正数。
以上可以看出，jdk还是蛮严谨的，为了效率也是拼了。
但实际测试的结果感觉运算效率并没有很大提高，可能是以前的ALU没有现在的先进。

toString(int, int)

接下来看看toString(int i, int radix)，这个方法主要是将形参i转成radix进制的数

public static String toString(int i, int radix) {
    // 如果小于2进制或大于36进制，当成10进制处理
    if (radix < Character.MIN_RADIX || radix > Character.MAX_RADIX)
        radix = 10;

    /* Use the faster version */
    // 10进制数，直接使用更快的版本
    if (radix == 10) {
        return toString(i);
    }

    // Integer最多占用33位，数字32位，符号1位
    char buf[] = new char[33];
    boolean negative = (i < 0);// 判断是否为负数，后面i被当成负数来统一处理
    int charPos = 32;// buf最末尾的索引，从32开始

    // 如果i是正数，取反，当成负数处理
    if (!negative) {
        i = -i;
    }

    // i%radix的余数的绝对值放到buf当前尾部(charPos)位置
    while (i <= -radix) {
        buf[charPos--] = digits[-(i % radix)];
        i = i / radix;
    }
    buf[charPos] = digits[-i];

    // 如果i是负数，加上'-'
    if (negative) {
        buf[--charPos] = '-';
    }
    // 返回字符串，从buf的charPos位置开始截取，长度33-charPos，正好是最后一个位置，索引下标为32
    return new String(buf, charPos, (33 - charPos));
}

toString()

无参的toString就没什么难度了，就是把Integer封装的value转成字符串

public String toString() {
    return toString(value);
}

toHexString(int)

接下来看看几个无符号进制的转换

public static String toHexString(int i) {
    return toUnsignedString(i, 4);
}
public static String toOctalString(int i) {
    return toUnsignedString(i, 3);
}
public static String toBinaryString(int i) {
    return toUnsignedString(i, 1);
}
/**
 * 本质上就是理解这个方法
 * 因为是无符号，所以所有数字其实都可以想象成二进制的情况，如17则是0000 0000 0000 0000 0000 0001 0001 0001,-17则是1111 1111 1111 1111 1111 1111 1110 1111
 */
private static String toUnsignedString(int i, int shift) {
    // 无符号数，只需存32位即可
    char[] buf = new char[32];
    // 可插入的尾部位置
    int charPos = 32;
    // 进制
    int radix = 1 << shift;
    // 类似掩码的作用，二进制是对应的是0001,八进制对应0111，十六进制对应1111
    int mask = radix - 1;
    do {
        // 关键理解i & mask，整个过程就像手工转换进制一样，先得到二进制，然后每几位一组转换，如0001 0001转成8进制，每3位一组：00 010 001，然后得到0 2 1，所以17的8进制表示就是21，i & mask的过程就像分组，每次迭代将mask对应的位数得到，再利用digits转换成对应的字符
        buf[--charPos] = digits[i & mask];
        i >>>= shift;
    } while (i != 0);

    return new String(buf, charPos, (32 - charPos));
}

演示一下i & mask的过程：

i=17,mask=7，则相当于0001 0001 & 0111 得到001,digit[1]
=1,第二次迭代i=000 010,000 010 & 0111得到010,digit[2]=2,迭代结束，buf=21。
i=17,mask-15，则相当于0001 0001 & 1111 得到0001,digit[1]
=1,第二次迭代i=0001,0001 & 1111得到0001,digit[1]=1,迭代结束,buf=11。

parseInt(String, int)

接着看parseInt方法，进制转换的公式：a * radix^0 + b * radix^1 + c * radix^2 + ... + xx * radix^(n-1)

/**
 * 整个过程的关键点都在判断下一次迭代会不会导致溢出
 * 
 */
public static int parseInt(String s, int radix)
            throws NumberFormatException
{
    /*
     * WARNING: This method may be invoked early during VM initialization
     * before IntegerCache is initialized. Care must be taken to not use
     * the valueOf method.
     */

    // 下面都是判断s不能为空，进制必须在[2, 36]，可以看到jdk的源码处理也有问题，之前进制转换的，不在[2, 36]之间就当成10进制处理，现在是抛异常，规则不一样
    if (s == null) {
        throw new NumberFormatException("null");
    }

    if (radix < Character.MIN_RADIX) {
        throw new NumberFormatException("radix " + radix +
                                        " less than Character.MIN_RADIX");
    }

    if (radix > Character.MAX_RADIX) {
        throw new NumberFormatException("radix " + radix +
                                        " greater than Character.MAX_RADIX");
    }

    // 当前的转换结果
    int result = 0;
    // 后面的处理都基于负数处理，一方面是统一规则，另外Integer.MIN_VALUE的绝对值比较大
    boolean negative = false;
    int i = 0, len = s.length();
    // 后面两个参数限制溢出的作用
    int limit = -Integer.MAX_VALUE;
    // 界定溢出，具体看下面的注释
    int multmin;
    // 通过Character#digit转换过来的数值
    int digit;

    if (len > 0) {
        // 处理第一个字符
        char firstChar = s.charAt(0);
        if (firstChar < '0') { // Possible leading "+" or "-"
            if (firstChar == '-') {
                negative = true;
                // 如果是负数，溢出标志变成Integer.MIN_VALUE
                limit = Integer.MIN_VALUE;
            } else if (firstChar != '+')
                throw NumberFormatException.forInputString(s);

            if (len == 1) // Cannot have lone "+" or "-"
                throw NumberFormatException.forInputString(s);
            i++;
        }
        // 界定是否溢出的标志，假设10进制最大是211，则multmin = 211 / 10 = 21，假设现在result为30，那么下一次迭代result *= radix肯定会大于211，溢出了。
        multmin = limit / radix;
        while (i < len) {
            // Accumulating negatively avoids surprises near MAX_VALUE
            // 转换函数，具体在Character类了解
            digit = Character.digit(s.charAt(i++),radix);
            if (digit < 0) {
                throw NumberFormatException.forInputString(s);
            }
            // 因为是当成负数(limit是负数)处理，相当于正数的result > multmin
            if (result < multmin) {
                throw NumberFormatException.forInputString(s);
            }
            result *= radix;// 迭代，就是套公式a * radix^(n-1)的过程
            // 同样是判断溢出的过程，继续上面的分析，result现在是210，如果digit是2，则转换后的result = 212，也是溢出了。
            if (result < limit + digit) {
                throw NumberFormatException.forInputString(s);
            }
            result -= digit;// 公式里相加的过程，负数的话就是减
        }
    } else {
        throw NumberFormatException.forInputString(s);
    }
    return negative ? result : -result;
}
// 这个就是调用上面的方法
public static int parseInt(String s) throws NumberFormatException {
  return parseInt(s,10);
}

valueOf()

接着看看valueOf方法，在看valueOf方法之前，需要先看看IntegerCache，顾名思义，这个是整数的缓存，默认情况下，IntegetCache会缓存[-128, 127]的所有实例，所以正常情况下，在这两个值范围内的对象都是相等的(==返回true)，因为它们引用的是同一块内存上的对象，有点单例的意思，当然可以通过启动参数-XX:AutoBoxCacheMax=size来修改缓存的内容(size必须大于127，否则当成127)来让jvm缓存[-size-1, size]的对象。看看代码：

private static class IntegerCache {
        static final int low = -128;
        static final int high;
        static final Integer cache[];

        static {
            // high value may be configured by property
            int h = 127;
            String integerCacheHighPropValue =
                sun.misc.VM.getSavedProperty("java.lang.Integer.IntegerCache.high");
            if (integerCacheHighPropValue != null) {
                int i = parseInt(integerCacheHighPropValue);
                i = Math.max(i, 127);// 如果配置的值比127小，缓存上界还是127
                // Maximum array size is Integer.MAX_VALUE
                h = Math.min(i, Integer.MAX_VALUE - (-low) -1);
            }
            high = h;

            cache = new Integer[(high - low) + 1];
            int j = low;
            // 对象一个个缓存起来，用cache数组保存
            for(int k = 0; k < cache.length; k++)
                cache[k] = new Integer(j++);
        }

        private IntegerCache() {}
    }

具体看看valueOf方法

// 调用的parseInt方法以及分析过
public static Integer valueOf(String s, int radix) throws NumberFormatException {
  return Integer.valueOf(parseInt(s,radix));
}
public static Integer valueOf(String s) throws NumberFormatException {
  return Integer.valueOf(parseInt(s, 10));
}
public static Integer valueOf(int i) {
  assert IntegerCache.high >= 127;// 防止IntegetCache函数上界不是127
  // 在[IntegetCache.low, Integer.high]直接的直接从缓存中返回
  if (i >= IntegerCache.low && i <= IntegerCache.high)
    return IntegerCache.cache[i + (-IntegerCache.low)];
  return new Integer(i);// 否则新建一个实例
}

转载请注明出处

java.lang.Integer源码精读(一)
地址：https://www.jianshu.com/p/02c1d9092347

java.lang.Integer源码精读(一)
JDK源码精读汇总帖类声明抽象类 Number 是 BigDecimal、BigInteger、Byte、Do...
java.lang.Integer源码精读(二)
分享不易，喜欢请点赞支持，谢谢 JDK源码精读汇总帖 getInteger() 然后比较少用的方法getInteg...
java.lang.Integer源码分析
Integer 本文源码基于JDK8 Integer也是我们经常使用的工具类、包装类，此文主要用于记录学习笔记，主...
java.lang.Integer源码分析
1. 描述 API：int的包装类型，内部包含了一个int字段。关键字段： 2. 构造函数第一种直接赋值：传...
java.lang.Integer线程安全吗？
java.lang.Integer线程安全因为 private final int value; 不可变。
8. String to Integer (atoi)
看一下java.lang.Integer的实现(并不是本题的解)
精读《sqorn 源码》
1 引言前端精读《手写 SQL 编译器系列》介绍了如何利用 SQL 生成语法树，而还有一些库的作用是根据语法树...
精读LinkedList源码
概述 ArrayList是最常用的List实现类，内部是通过数组实现的，它允许对元素进行快速随机访问。数组的缺点是...
Javadoc归类
第一级别：精读源码 java.io Provides for system input and output th...
【比特币源码精读一】
/** bitcoind.cpp 启动源码 */ //source code int main(int arg...