美文网首页
数组名 & 指针

数组名 & 指针

作者: R0b1n_L33 | 来源:发表于2018-03-25 12:32 被阅读28次

    先来看看如下示例代码:

    int arr[10];
    int *p1 = arr;
    int *p2 = (int*)&arr;
    int (*p3)[10] = &arr;
    printf("%p %p %p", p1, p2, p3);
    

    输出:

    0x7fffaeaff340 0x7fffaeaff340 0x7fffaeaff340

    我们知道 数组名可以理解为指向一维数组首元素的指针常量

    然而由于数组是一种类型,所以并不能单纯的作为指针常量去判断所有问题

    那么&arr是什么?如果arr是指针常量,那么&arr应当是arr的地址

    但是 事实上arr与&arr是相等的

    这是与指针没有直接关系的,而是数组本身内部的属性

    亦即arr存储首元素地址,&arr存储数组地址,并且两个地址相同

    基于以上前提,结合我的实验数据,咱们回归本题B选项

    int *p1 = arr;
    

    有人认为是指向一维数组的指针

    有人认为是指向一维数组首元素的指针

    造成这种分歧的原因正是因为两个指针存储的地址值是一样的缘故

    而指针是由地址值+数据类型来决定的

    所以不能单纯以地址值来谈论,还要基于其指向的数据类型

    因为毕竟数据类型决定了指针移动的步长

    所以我们写int *p=&arr;这样的语句是编译不通过的

    编译器告诉我们:

    error: cannot convert 'int (*)[10]' to 'int*' in initialization

    那么由此可知,编译器认为int *指向数组元素,而'int (*)[10]'指向数组

    这正是类型对指针的决定性影响

    所以综上愚以为此处的int *p只能指向一维数组首元素

    但是鉴于arr 与 &arr地址值的相等性

    所以试验中我使用了强制类型转换 int *p2 = (int*)&arr;

    这样编译就通过了

    但无法改变int *只能指向单个元素的事实

    类似的情况还有函数名

        void foo() {}
        printf("%p %p\n", foo, &foo);
    

    这里打印出

    0x100000f40 0x100000f40

    与数组名的区别在于

    此处foo和&foo是相同的函数指针void(*)()类型

    而arr与&arr的指针类型不同

    前者指向元素 后者指向数组

    至于有的朋友问动态一维数组算不算一维数组

    int *p = new int[10];
    

    这个可以查看C11文档关于new表达式的说明

    The new expression allocates a memory area, initializes either single object, or an array of objects there and returns a pointer to the first constructed object.

    由此可知new关键字创建动态数组时,返回首元素的指针

    援引 12.2.1的内容:

    Although it is common to refer to memory allocated by new T[] as a “dynamic array,” this usage is somewhat misleading. When we use new to allocate an array, we do not get an object with an array type. Instead, we get a pointer to the element type of the array. Even if we use a type alias to define an array type, new does not allocate an object of array type. In this case, the fact that we’re allocating an array is not even visible; there is no [num]. Even so, new returns a pointer to the element type.

    大意如下:

    虽然我们常把new分配的T[]对象称为“动态数组”,但是这种说法有点误导人。因为当使用new来分配一个数组,我们并未得到一个数组类型的对象。相反地,我们得到的是一个指向数组元素的指针。即使我们使用一个类型别名来定义某种数组类型,new也不会分配一个数组类型的对象。在这种情况下,你看不出我们是在分配一个数组,因为数组长度[num]压根没有体现出来。所以,new返回的是一个指向数组元素的指针。

    D选项事实上是值得商榷的,因为它与上文所引用的C++文档和C++ Primer的论述不符。如果A选项精确表达了数组名的语义(semantics),那么new的语义应该和A选项具有一致性。也就是说,没有什么指针能指向所谓的“动态数组”(dynamic array)。我们new T[num]时,只是分配了sizeof(T)*num大小的堆区内存而已,并没有什么数组类型被创建。返回的只是一个T类型的指针,让你可以方便通过这个指针获得这块堆内存的首地址。以后你想要访问这块地址上的元素,就可以通过这个指针迭代器,以相同的sizeof(T)步长迭代访问这块内存上的元素。

    所以,new的返回值和数组名arr一样,视为int *类型

    综合上述,D选项错

    我的最终结论是 int *p 只能是一个指向int型值的指针

    附加福利:

    我们用汇编来看看new方法的内部实现

    考虑如下示例代码:

        int *p = new int[3]();
        *p = 1;
        *(p+1) = 2;
        *(p+2) = 3;
    

    编译为如下汇编码:

    (芯片架构为X86_64,汇编语法格式为AT&T)

    # eax寄存器存入12,即我们的动态数组所需空间总大小
    movl    $12, %eax
    # edi寄存器存入12,作为下面调用的__Znam函数的第一个参数(也是唯一一个)
    movl    %eax, %edi
    # 系统调用libkern中的__Znam函数,用于申请12字节的堆内存,返回内存首地址到rax寄存器
    callq    __Znam
    # ecx寄存器清零
    xorl    %ecx, %ecx
    # edx寄存器存入12,即我们的动态数组所需空间总大小,作为_memset函数的第三个参数
    movl    $12, %edx
    # 将__Znam函数返回的堆内存首地址存入rdi寄存器,作为_memset函数的第一个参数
    movq    %rax, %rdi
    # 将ecx寄存器中的值,即0,存入esi寄存器,作为_memset函数的第二个参数
    movl    %ecx, %esi
    # 由于下面调用memset函数后会使用rax存储返回值,所以需要在栈里保存一下rax中的动态数组首地址
    movq    %rax, -16(%rbp)         ## 8-byte Spill
    # 保存一下ecx中的动态数组元素默认值
    movl    %ecx, -20(%rbp)         ## 4-byte Spill
    # 调用memset函数初始化动态数组元素,每个字节清零
    callq    _memset
    # 动态数组首地址出栈,最终存入rdx寄存器
    movq    -16(%rbp), %rax         ## 8-byte Reload
    movq    %rax, -8(%rbp)
    movq    -8(%rbp), %rdx
    # 实现代码中的逻辑,在动态数组第一个元素中存入立即数1
    movl    $1, (%rdx)
    movq    -8(%rbp), %rdx
    # 在动态数组第二个元素中存入立即数2
    movl    $2, 4(%rdx)
    movq    -8(%rbp), %rdx
    # 在动态数组第三个元素中存入立即数3
    movl    $3, 8(%rdx)
    # 最终返回值寄存器rax中存储的是动态数组内存首地址
    

    其中用到的memset函数原型为

    void *memset(void *__b, int __c, size_t __len);
    

    由汇编代码可以清晰地看到new函数的实现过程事实上就是两步:

    1. 调用__Znam函数分配内存空间
    2. 调用_memset函数初始化内存

    第二步是可选的,因为示例代码中定义动态数组的语句为

    int *p = new int[3]();
    

    所以会有第二步
    假如按照如下方式声明则不会有第二步

    int *p = new int[3];
    

    一个括号引发的血案,区别在于
    前者会使用值初始化
    后者使用默认初始化

    回到正题
    最终函数返回值为__Znam函数返回的动态内存空间首地址
    也就是说就是个void *
    大家最终对其进行任何强制转换都可以
    当然在代码中我们定义为什么类型,返回的就是什么类型
    只是大家知道 到了底层其实没所谓类型的
    只有数据宽度
    而指针这种东西 在X86_64架构就是8字节数据
    无所谓类型

    相关文章

      网友评论

          本文标题:数组名 & 指针

          本文链接:https://www.haomeiwen.com/subject/kuphcftx.html