unicode
先记录下字符串转unicode的情况。
字符串得到char,char是utf-16BE的。然后转成16进制,就是这个char对应的unicode,将所有char的unicode拼起来,就是字符串的unicode。
注意如果直接字符串转utf-16的byte数组话,会带着FE或者FF标识大端在前还是小端在前。而java中默认是utf-16BE的
byte[] bytes = "你".getBytes("utf-16");
System.out.println(bytes.length);
for (int i = 0; i < bytes.length; i++) {
byte b = bytes[i];
System.out.println(b);
}
输出:4
-2
-1
79
96
byte[] bytes = "你".getBytes("utf-16BE");
System.out.println(bytes.length);
for (int i = 0; i < bytes.length; i++) {
byte b = bytes[i];
System.out.println(b);
}
输出:2
79
96
byte的符号位
到这里有个问题,-2是0xFE -1 是0xFF
byte,即字节,由8位的二进制组成。在Java中,byte类型的数据是8位带符号的二进制数。
在计算机中,8位带符号二进制数的取值范围是[-128, 127],所以在Java中,byte类型的取值范围也是[-128, 127]。
正数的最高位都是 0 ,正数的值就是二进制表示的值。
负数的最高位都是 1 ,负数的值是 取反后加一 然后加个负号得到得值。
不难理解,byte的最大正数就是 01111111(最高位必须是0),也就是 127。
那么你可能会想 byte的最小负数就是 11111111 了,对不对? 这么想就
大错特错了。让我们看看11111111这个二进制数表示多少。
根据上面的提示 我们知道这是一个负数。它的值是先取反再加1 。
11111111取反得到:00000000,加1得到 00000001 。最后得到的值为-1.
由此你是不是想到了最小的负数会不会是10000000呢?
让我们算一下 取反:01111111 加1得到 10000000 最后得到 -128.
short
- short 数据类型是 16 位、有符号的以二进制补码表示的整数
- 最小值是 -32768(-2^15);
- 最大值是 32767(2^15 - 1);
网友评论