美文网首页
基础0:数据在内存中的大小端模式

基础0:数据在内存中的大小端模式

作者: 长仙人 | 来源:发表于2017-01-20 19:13 被阅读47次

    定义

    大端模式(Big-Endian):数字的低位字节保存在内存地址的高位,高位字节保存在内存地址的低位。

    小端模式(Small-Endian):与Big-Endian相反。

    数字0x12345678,数据以8bit为单位:

    • 大端模式:
    Address a a + 1 a + 2 a + 3
    Value 0x12 0x34 0x56 0x78
    • 小端模式:
    Address a a + 1 a + 2 a + 3
    Value 0x78 0x56 0x34 0x12

    为什么会有大小端?

    端(endian)的起源

    引述wikipedia:

    endian”一词来源于乔纳森·斯威夫特的小说格列佛游记。小说中,小人国为水煮蛋该从大的一端(Big-End)剥开还是小的一端(Little-End)剥开而争论,争论的双方分别被称为“大端派”和“小端派”。以下是1726年关于大小端之争历史的描述:

    “我下面要告诉你的是,Lilliput和Blefuscu这两大强国在过去36个月里一直在苦战。战争开始是由于以下的原因:我们大家都认为,吃鸡蛋前,原始的方法是打破鸡蛋较大的一端,可是当今皇帝的祖父小时候吃鸡蛋,一次按古法打鸡蛋时碰巧将一个手指弄破了。因此他的父亲,当时的皇帝,就下了一道敕令,命令全体臣民吃鸡蛋时打破鸡蛋较小的一端,违令者重罚。老百姓们对这项命令极其反感。历史告诉我们,由此曾经发生过6次叛乱,其中一个皇帝送了命,另一个丢了王位。这些叛乱大多都是由Blefuscu的国王大臣们煽动起来的。叛乱平息后,流亡的人总是逃到那个帝国去寻求避难。据估计,先后几次有11000人情愿受死也不肯去打破鸡蛋较小的一端。关于这一争端,曾出版过几百本大部著作,不过大端派的书一直是受禁的,法律也规定该派任何人不得做官。”

    1980年, Danny Cohen,一位网络协议的早期开发者,在其著名的论文"On Holy Wars and a Plea for Peace"中,为平息一场关于字节该以什么样的顺序传送的争论,而第一次引用了该词。

    在哪种字节顺序更合适的问题上,人们表现得非常情绪化,实际上,就像鸡蛋的问题一样,没有技术上的原因来选择字节顺序规则,因此,争论沦为关于社会政治问题的争论,只要选择了一种规则并且始终如一地坚持,其实对于哪种字节排序的选择是任意的。

    技术原因呢?

    大端模式的内存排布非常直观,就是最常用的高位到地位的数字表达方式。那小端模式存在的意义是什么?不可能是自找别扭吧,设计处理器的前辈们聪明的很。小端模式的优势在于,当进行数值转换时,其地址是保持不变的。例如:

    int a = 0x12345678;
    char b = (char)a;
    // b的值应该为0x78
    

    大端模式下,整数a的指针指向的是0x12,进行强制转换时其指针需要向后移动到0x78。而小端模式下,整数a的指针指向的是0x78,进行数值转换也不需要移动指针。对编译器来说,小端模式下数值的类型转换,需更少的指令。

    程序判断大小端

    #include <stdio.h>
    
    int main()
    {
        int num = 0x12345678;
        char n0 = ((char *) &num)[0];
        char n1 = ((char *) &num)[1];
        char n2 = ((char *) &num)[2];
        char n3 = ((char *) &num)[3];
    
        if (n0 == 0x12) {
            printf("this is Big Endian\n");
        } else {
            printf("this is Little Endian\n");
        }
    
        // 内存从低到高分别打印四个字节的内容
        printf("%p: 0x%x\n", &((char *) &num)[0], n0);
        printf("%p: 0x%x\n", &((char *) &num)[1], n1);
        printf("%p: 0x%x\n", &((char *) &num)[2], n2);
        printf("%p: 0x%x\n", &((char *) &num)[3], n3);
        return 0;
    }
    

    参考链接

    1. 深入浅出: 大小端模式
    2. 基础02:内存的大小端
    3. wiki 字节顺序

    相关文章

      网友评论

          本文标题:基础0:数据在内存中的大小端模式

          本文链接:https://www.haomeiwen.com/subject/bsxgbttx.html