先来看看如下示例代码:
int arr[10];
int *p1 = arr;
int *p2 = (int*)&arr;
int (*p3)[10] = &arr;
printf("%p %p %p", p1, p2, p3);
输出:
0x7fffaeaff340 0x7fffaeaff340 0x7fffaeaff340
我们知道 数组名可以理解为指向一维数组首元素的指针常量
然而由于数组是一种类型,所以并不能单纯的作为指针常量去判断所有问题
那么&arr是什么?如果arr是指针常量,那么&arr应当是arr的地址
但是 事实上arr与&arr是相等的
这是与指针没有直接关系的,而是数组本身内部的属性
亦即arr存储首元素地址,&arr存储数组地址,并且两个地址相同
基于以上前提,结合我的实验数据,咱们回归本题B选项
int *p1 = arr;
有人认为是指向一维数组的指针
有人认为是指向一维数组首元素的指针
造成这种分歧的原因正是因为两个指针存储的地址值是一样的缘故
而指针是由地址值+数据类型来决定的
所以不能单纯以地址值来谈论,还要基于其指向的数据类型
因为毕竟数据类型决定了指针移动的步长
所以我们写int *p=&arr;这样的语句是编译不通过的
编译器告诉我们:
error: cannot convert 'int (*)[10]' to 'int*' in initialization
那么由此可知,编译器认为int *指向数组元素,而'int (*)[10]'指向数组
这正是类型对指针的决定性影响
所以综上愚以为此处的int *p只能指向一维数组首元素
但是鉴于arr 与 &arr地址值的相等性
所以试验中我使用了强制类型转换 int *p2 = (int*)&arr;
这样编译就通过了
但无法改变int *只能指向单个元素的事实
类似的情况还有函数名
void foo() {}
printf("%p %p\n", foo, &foo);
这里打印出
0x100000f40 0x100000f40
与数组名的区别在于
此处foo和&foo是相同的函数指针void(*)()类型
而arr与&arr的指针类型不同
前者指向元素 后者指向数组
至于有的朋友问动态一维数组算不算一维数组
int *p = new int[10];
这个可以查看C11文档关于new表达式的说明
The new expression allocates a memory area, initializes either single object, or an array of objects there and returns a pointer to the first constructed object.
由此可知new关键字创建动态数组时,返回首元素的指针
援引 12.2.1的内容:
Although it is common to refer to memory allocated by new T[] as a “dynamic array,” this usage is somewhat misleading. When we use new to allocate an array, we do not get an object with an array type. Instead, we get a pointer to the element type of the array. Even if we use a type alias to define an array type, new does not allocate an object of array type. In this case, the fact that we’re allocating an array is not even visible; there is no [num]. Even so, new returns a pointer to the element type.
大意如下:
虽然我们常把new分配的T[]对象称为“动态数组”,但是这种说法有点误导人。因为当使用new来分配一个数组,我们并未得到一个数组类型的对象。相反地,我们得到的是一个指向数组元素的指针。即使我们使用一个类型别名来定义某种数组类型,new也不会分配一个数组类型的对象。在这种情况下,你看不出我们是在分配一个数组,因为数组长度[num]压根没有体现出来。所以,new返回的是一个指向数组元素的指针。
D选项事实上是值得商榷的,因为它与上文所引用的C++文档和C++ Primer的论述不符。如果A选项精确表达了数组名的语义(semantics),那么new的语义应该和A选项具有一致性。也就是说,没有什么指针能指向所谓的“动态数组”(dynamic array)。我们new T[num]时,只是分配了sizeof(T)*num大小的堆区内存而已,并没有什么数组类型被创建。返回的只是一个T类型的指针,让你可以方便通过这个指针获得这块堆内存的首地址。以后你想要访问这块地址上的元素,就可以通过这个指针迭代器,以相同的sizeof(T)步长迭代访问这块内存上的元素。
所以,new的返回值和数组名arr一样,视为int *类型
综合上述,D选项错
我的最终结论是 int *p 只能是一个指向int型值的指针
附加福利:
我们用汇编来看看new方法的内部实现
考虑如下示例代码:
int *p = new int[3]();
*p = 1;
*(p+1) = 2;
*(p+2) = 3;
编译为如下汇编码:
(芯片架构为X86_64,汇编语法格式为AT&T)
# eax寄存器存入12,即我们的动态数组所需空间总大小
movl $12, %eax
# edi寄存器存入12,作为下面调用的__Znam函数的第一个参数(也是唯一一个)
movl %eax, %edi
# 系统调用libkern中的__Znam函数,用于申请12字节的堆内存,返回内存首地址到rax寄存器
callq __Znam
# ecx寄存器清零
xorl %ecx, %ecx
# edx寄存器存入12,即我们的动态数组所需空间总大小,作为_memset函数的第三个参数
movl $12, %edx
# 将__Znam函数返回的堆内存首地址存入rdi寄存器,作为_memset函数的第一个参数
movq %rax, %rdi
# 将ecx寄存器中的值,即0,存入esi寄存器,作为_memset函数的第二个参数
movl %ecx, %esi
# 由于下面调用memset函数后会使用rax存储返回值,所以需要在栈里保存一下rax中的动态数组首地址
movq %rax, -16(%rbp) ## 8-byte Spill
# 保存一下ecx中的动态数组元素默认值
movl %ecx, -20(%rbp) ## 4-byte Spill
# 调用memset函数初始化动态数组元素,每个字节清零
callq _memset
# 动态数组首地址出栈,最终存入rdx寄存器
movq -16(%rbp), %rax ## 8-byte Reload
movq %rax, -8(%rbp)
movq -8(%rbp), %rdx
# 实现代码中的逻辑,在动态数组第一个元素中存入立即数1
movl $1, (%rdx)
movq -8(%rbp), %rdx
# 在动态数组第二个元素中存入立即数2
movl $2, 4(%rdx)
movq -8(%rbp), %rdx
# 在动态数组第三个元素中存入立即数3
movl $3, 8(%rdx)
# 最终返回值寄存器rax中存储的是动态数组内存首地址
其中用到的memset函数原型为
void *memset(void *__b, int __c, size_t __len);
由汇编代码可以清晰地看到new函数的实现过程事实上就是两步:
- 调用__Znam函数分配内存空间
- 调用_memset函数初始化内存
第二步是可选的,因为示例代码中定义动态数组的语句为
int *p = new int[3]();
所以会有第二步
假如按照如下方式声明则不会有第二步
int *p = new int[3];
一个括号引发的血案,区别在于
前者会使用值初始化
后者使用默认初始化
回到正题
最终函数返回值为__Znam函数返回的动态内存空间首地址
也就是说就是个void *
大家最终对其进行任何强制转换都可以
当然在代码中我们定义为什么类型,返回的就是什么类型
只是大家知道 到了底层其实没所谓类型的
只有数据宽度
而指针这种东西 在X86_64架构就是8字节数据
无所谓类型
网友评论