美文网首页
java中整型数据(byte、short、int、long)溢出

java中整型数据(byte、short、int、long)溢出

作者: tinyvampirepudg | 来源:发表于2020-05-04 21:03 被阅读0次

    我们都知道Java中基本数据类型中,整型的有byteshortintlong,依次占用内存空间是1、2、4、8个字节,它们的取值范围如下:

    | 类型 | 字节数 | 取值范围 |
    | --- | --- | --- | --- |
    | byte | 1 | [-128,127] |
    | short | 2 | [-32768,32767] |
    | int | 4 | [-2147483648,2147483647] |
    | long | 8 | [-9223372036854775808,9223372036854775807] |

    既然数据有范围,那么就会存在数据溢出的问题,那么我们看下数据溢出了会是怎样的?

    byte数据溢出现象

    测试代码如下:

    byte b = Byte.MAX_VALUE;// 127
    System.out.println("Byte.MAX_VALUE:" + b);
    b = (byte) (b + 1);// 由于整型数据会自动向上转型为int,所以这里需要强转。
    System.out.println("Byte.MAX_VALUE+1:" + b);// -128
    

    这里我们给byte的最大值加1,然后再赋值给byte类型,输出如下:

    Byte.MAX_VALUE:127
    Byte.MAX_VALUE+1:-128
    

    可以看到输出的是-128,跟我们想象的有点不太一样,接下来我们分析下原理。

    原理分析

    我们知道,整型数据在计算机中都是用二进制表示的。这里我们继续拿byte进行举例,比如说1的二进制表示为0000 0001-1的二进制表示为1000 0001,最高位是符号位,1表示负数,0表示正数。

    我们知道byte类型占一个字节,也就是8bit,那么它应该能表示128个数字;除去最高位的符号位后,还有7个bit来表示数字,也就是[0,127]这个范围,共128个数字;如果加上符号位,那么byte可以表示的数的范围是[-127,-0][0,127],-0和0表示的数据相同,我们进行合并,所以范围应该是[-127,127],而java规定的范围是[-128,127]-128怎么表示的。

    其实-128就是用-0来表示的,二进制的补码表示就是1000 0000

    接下来我们说下几个基本概念:原码、反码和补码。

    原码、反码和补码

    原码:就是数据的二进制表示形式,最高位是符号位,1表示负数,0表示正数。

    反码:正数的反码跟原码相同;负数的反码是在原码的基础上,符号位不变,其余各位取反,1变0,0变1。

    补码:正数的补码跟原码相同;负数的补码是在其反码的基础上加1。

    比如说,10的原码是0000 1010,由于它是正数,所以它的反码和补码均与原码相同。
    -10的原码是1000 1010;它的反码是在原码基础上,符号位不变,其余位数取反,转换后的反码是1111 0101;补码是在反码的基础上+1,转换后的补码是1111 0110

    加法运算过程拆解

    在计算机的二进制计算中,减法运算也会转化为加法运算来计算。

    对于10-10=0的这个运算,在实际计算过程中,会将10 - 10的操作转化为10 + (-10)。接下来我们看下具体的运算过程:

    数据类型 10 -10
    原码 0000 1010 1000 1010
    反码 0000 1010 1111 0101
    补码 0000 1010 1111 0110

    得到对应的补码之后,我们对10-10的补码进行加法操作:

    + 0000 1010
    ——————————— = 0000 0000
      1111 0110
    

    我们知道补码0000 0000对应的原码也为0000 0000,所以可以得出10 - 10 = 0

    验证(byte)(127 +1)结果

    我们接着看下byte类型的127 + 1的运算过程。

    数据类型 127 1
    原码 0111 1111 0000 0001
    反码 0111 1111 0000 0001
    补码 0111 1111 0000 0001

    得到对应的补码之后,我们对相应的补码进行加法操作:

    + 0111 1111
    ——————————— = 1000 0000
      0000 0001
    

    这里我们得到了1000 0000这个补码,而这个补码对应的数据就是-128,这是一个特例。

    这里需要注意的是,因为使用以前的-0的补码来表示-128, 所以-128并没有原码和反码表示。(对-128的补码表示[1000 0000]补算出来的原码是[0000 0000], 这是不正确的)。

    byte越界后的数据其实是循环展示[-128,127]

    接下来我们看另一个例子,代码如下:

    byte b = (byte) (Byte.MAX_VALUE + 255);
    System.out.println("Byte.MAX_VALUE+255:" + b);
    b = (byte) (Byte.MAX_VALUE + 256);
    System.out.println("Byte.MAX_VALUE+256:" + b);
    b = (byte) (Byte.MAX_VALUE + 257);
    System.out.println("Byte.MAX_VALUE+257:" + b);
    

    output:

    Byte.MAX_VALUE+255:126
    Byte.MAX_VALUE+256:127
    Byte.MAX_VALUE+257:-128
    

    一个字节可表示的数据个数是256,结合前面(byte)(127 +1)的结果是-128,我们可以得出一个结论,越界后的数据会以byte的取值范围为一个单元,一直循环下去。

    其他整型:short、int、long

    整型的计算规则都是一样的,同理可得,其他的整型(short、int、long)也有同样的现象。测试代码如下:

    short s = Short.MAX_VALUE;
    System.out.println("Short.MAX_VALUE:" + s);
    s = (short) (s + 1);
    System.out.println("Short.MAX_VALUE+1:" + s);
    
    int i = Integer.MAX_VALUE;
    System.out.println("Integer.MAX_VALUE=" + i);
    i = i + 1;
    System.out.println("Integer.MAX_VALUE+1=" + i);
    
    long l = Long.MAX_VALUE;
    System.out.println("Long.MAX_VALUE=" + l);
    l = l + 1;
    System.out.println("Long.MAX_VALUE+1=" + l);
    

    输出如下:

    Short.MAX_VALUE:32767
    Short.MAX_VALUE+1:-32768
    Integer.MAX_VALUE=2147483647
    Integer.MAX_VALUE+1=-2147483648
    Long.MAX_VALUE=9223372036854775807
    Long.MAX_VALUE+1=-9223372036854775808
    

    可以看出,它们取值范围的最大值+1的结果都是它们取值范围的最小值,相当于开启了取值范围的下一个循环。

    参考

    Java中,为什么byte类型的取值范围为-128~127?

    【思考笔记】byte数据溢出的现象及原理

    相关文章

      网友评论

          本文标题:java中整型数据(byte、short、int、long)溢出

          本文链接:https://www.haomeiwen.com/subject/ovqughtx.html