大小端字节序

作者: iDeveloper | 来源:发表于2023-11-28 15:37 被阅读0次

大小端字节序
大小端字节序
字节序
iOS简单判断大小端字节序
字节序
字节对齐与大端小端与内存区域划分
[Golang] Bytes大小端int32转float32
python 字节序
Linux的socket API基本操作
内存序、字面量、动态规划

字节序和大小端

对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如何将多个字节安排的问题。

小端模式：（高高低低）高字节放在高地址，低字节放在低地址
大端模式：（高低低高）高字节放在低地址，低字节放在高地址

举个例子，数值 0x12345678，其中 0x12 这一端是高位字节，0x78 这一端是低位字节。
该数值的存储顺序是这样的：

image.png

image 2.png

为什么没有统一？

检查奇偶性（小端占优）

小端序优势最明显的，大概就是检查奇偶性，即通过查看个位数，确定某个数字是奇数还是偶数。

bg2022060112.jpeg

以123456为例，大端序从左到右排列，计算机必须一直读到最后一位的个位数6，才能确定这是偶数。
小端序是从右到左排列，个位数在第一位。所以，只要读取第一位，就能确定它是偶数。

检查正负号（大端占优）

一个类似的场景是检查正负号，确定一个数是正数还是负数。

bg2022060113.jpg

大端序的符号位在左边第一位，小端序的符号位在右边最后一位。所以，大端序有优势，只看第一位就能知道是不是负数。

比较大小（小端占优）

下一个操作是比较大小。现在有三个数字，需要比较大小：43662576，594，2。

bg2022060108.jpg

上图是大端序排列，因为是从左到右排列，所以三个数字在右边个位数对齐。比较大小时，计算机就不得不读取每一个数的所有位，直到个位数，再进行比较。
如果改成小端序，就是下面的排列方式。

bg2022060109.jpg

小端序是从右到左，所以三个数字在第一位对齐。计算机就不需要读取所有位，哪个数字先读不到下一位，就是最小的。比如，2这个数字就没有第二位，所以读到第二位时，就知道它是最小的。
所以，比较大小时，小端序有优势。

乘法（小端占优）

接下来，再看乘法操作。
乘法是逐位相乘，每一轮乘法都要向前进位。

bg2022060110.jpg

上图是大端序的24165乘以3841。大端序的乘法是向左进位，也就是向左边扩展，必须等到每一轮的结果都出来（上例是四轮），再相加统一写入内存。
如果改成小端序的乘法，就不需要等待下一轮的结果，每一轮都可以直接写入内存。

bg2022060111.jpg

上图是小端序的24165乘以3841。小端序的乘法是向右进位，也就是向右边扩展，左边的边界不变。每一轮结果写入内存后，就不需要移动，后面有变化只需要改动对应的位就行了。
因此，小端序的乘法有明显优势。

任意精度整数（小端占优）

上一个例子的从低位开始计算的特性，对于任意精度整数特别有用。任意精度整数又称大整数，可以存放任意大小的整数。
它的内部实现是把整数分成一个个较小的单位，通常是 uint32（无符号32位整数）或 uint64（无符号64位整数），按顺序组合在一起。

bg2022060115.jpg

如果是大端序，第一个 u64 就是这个整数最大的部分。运算时，一旦这个数发生变化，需要进位，后面的所有位都必须移动和改写。小端序发生进位时，往往就不需要所有位移动。
小端序的另一个好处是，如果逐字节的运算从个位数开始（比如乘法和加法），可以从左到右依次运算一个个 u64，算完上一个再读取下一个。大端序就不行，必须读取整个数以后再进行运算。

更改类型（小端占优）

最后一个例子是，C 语言有一种 cast 操作，可以强制改变变量的数据类型，比如把32位整数强行改变为16位整数。[图片上传中...(bg2022060114.jpg-7a8cc9-1701243293826-0)]

bg2022060114.jpg

上图中，32位整数0x00000001更改为16位整数0x0001，大端序是截去前面两个字节，这时指向这个地址的指针必须向后移动两个字节。
小端序就没有这个问题，截去的是后面两个字节，第一位的地址是不变的，所以指针不需要移动。

网络字节序和主机字节序

网络字节序：TCP/IP各层协议将字节序定义为Big Endian，即大端模式，TCP/IP协议中使用的字节序是大端序，方便不同主机字节序的设备进行网络传输数据。
主机字节序：整数在内存中存储的顺序，目前以Little Endian，即小端模式，比较普遍（不同的CPU有不同的字节序）。iOS、macOS都是小端序。

注意：不少文章说macOS是大端序，是错误的（参考：将 macOS App 移植到 Apple 芯片 - Apple Developer ）。

image 3.jpg

总结：
如果需要逐位运算，或者需要到从个位数开始运算，都是小端序占优势。反之，如果运算只涉及到高位，或者数据的可读性比较重要，则是大端序占优势。
一些硬件厂商的坚持，因此在多字节存储顺序上始终没有一个统一的标准。

如何判断大小端？

通过读取低位地址

#include <stdio.h>

int main() {
    __uint16_t val = 0x1234;

    char a = ((char *) &val)[0]; // 低位地址
    char b = ((char *) &val)[1]; // 高位地址

    printf("a = %x\n", a);
    printf("b = %x\n", b);

    if (a == 0x34) {
        printf("小端模式\n");
    } else {
        printf("大端模式\n");
    }

    return 0;
}

利用联合体

联合体是一种特殊的数据结构，联合体中的成员变量共用同一段内存。
我们定义一个 test 联合体，设置两个成员变量 a 和 b。

#include <stdio.h>

int main()
{
    union test {
        __uint32_t a;
        char b;
    };

    union test val;

    val.a = 0x12345678;

    printf("%x\n", val.b);

    if (val.b == 0x78) {
        printf("小端模式\n");
    } else {
        printf("大端模式\n");
    }

    return 0;
}

C 语言内置宏

// 小端模式
# define LITTLE_ENDIAN  __LITTLE_ENDIAN
// 大端模式
# define BIG_ENDIAN __BIG_ENDIAN
// 当前主机的字节序
# define BYTE_ORDER __BYTE_ORDER

#include <endian.h>

int main()
{
    if (BYTE_ORDER == LITTLE_ENDIAN) {
        printf("小端模式\n");
    } else {
        printf("大端模式\n");
    }

    return 0;
}

大小端转换

手动实现转换逻辑
只需要将高位字节与低位字节进行交换，就可以实现大小端的转换。

int main()
{
    __uint32_t val = 0x12345678;

    unsigned char *x = (unsigned char *) &val, tmp;

    // 0x78 与 0x12 进行交换
    tmp = x[0];
    x[0] = x[3];
    x[3] = tmp;

    // 0x56 与 0x34 交换
    tmp = x[1];
    x[1] = x[2];
    x[2] = tmp;

    // 输出：0x78563412
    printf("0x%x\n", val);

    return 0;
}

C 语言内置宏

// 转换 16 位整数
htobe16(x)
be16toh(x)

// 转换 32 位整数
htobe32(x)
be32toh(x)

// 转换 64 位整数
htobe64(x)
be64toh(x)

h 的意思是 host，表示小端模式。
be 的意思是 big-endian，表示大端模式。
16、32、64 的意思是 16 位、32 位、64 位整数，表示不同位数的整数转换。
参考：
将 macOS App 移植到 Apple 芯片 - Apple Developer
字节序探析：大端与小端的比较 - 阮一峰的网络日志
 大端模式和小端模式 - 她和她的猫

网友评论

本文标题：大小端字节序

本文链接：https://www.haomeiwen.com/subject/asatgdtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

大小端字节序

字节序和大小端

为什么没有统一？

检查奇偶性（小端占优）

检查正负号（大端占优）

比较大小（小端占优）

乘法（小端占优）

任意精度整数（小端占优）

更改类型（小端占优）

网络字节序和主机字节序

如何判断大小端？

通过读取低位地址

利用联合体

C 语言内置宏

大小端转换

C 语言内置宏

相关文章