一说到指针和数组,很多人都会潜意识的认为它们是等同的,但事实上指针和数组只在某些前提下等同。本篇将详细介绍这些知识。
4.1 指针等同于数组的情况
ANSI C中关于什么时候数组和指针时相同的,定义了如下规则:
规则1.表达式中的数组名被编译器当作一个指向该数组第一个元素的指针(具体见ANSI C标准第6.2.2.1节)。
规则2.下标总是与指针的偏移量相同(具体见ANSI C标准第6.3.2.1节)。
规则3.在函数参数的声明中,数组名被编译器当作指向该数组第一个元素的指针(具体见ANSI C标准第6.7.2.1节)。
根据规则1和规则2,我们可以知道,对数组下标的引用总是可以写成“一个指向数组的起始地址的指针加上偏移量”。
例如,我们声称:int a[10]; int *p,i=2;则,我们可以通过以下的方式来访问a[i]:
int a[10]; int *p,i=2;
p=a; p[i];
p=a; *(p + 1);
p=a+i; *p;
根据规则1、2,对数组的引用如a[i]在编译时总是被编译器改写成(a+i)。不管你是人为的显示用(a+i)表达式还是a[i],最终在编译器那都是*(a+i)。这也是人们常说指针和数组相同的原因之一。因为此时,不管是真的指针还是数组,都可以用指针\数组表示方法来取值。
根据规则3,我们可以知道,在函数的形参中,不管你是写数组还是指针,最后编译器都会按照指针的方式进行解释,也就是说以下几种方式是等价的:
int Func(int *pNow);
int Func(int Now[]);
int Func(int Now[200]);
因为这几种声明方式的最终结果都是int Func(int*);
C语言之所以把数组形参解释成指针的主要原因是为了提高参数传递的效率。因为把数组名解释成指向数组第一个元素的指针后,在参数传递的时候只需要把第一个元素的地址赋值给形参就行了,而不必将整个数组的值都赋值给形参。和这个道理类似,函数的返回值也不能是数组,而应用指针代替。但不同的是,在语法上函数的参数可以是数组(实质是指针)而函数的返回值不能是数组。
由于C语言并不提供对数组边界的检查,而且这种检查即费时也没有必要。所以,上述第二中写法和第三种写法是相同的。只有在定义数组时,数组的长度才是必要的,其他的情况下有没有数组的长度都无关紧要。
注:由于形参中的数组总是被转换为指向数组第一个元素的指针,所以用sizeof取的数组的大小始终是4。因为指针的大小就是4。
4.2 指针和数组的区别
如果指针和数组没有区别,那么就不需要这两种基本数据类型了。由于,指针和数组是常见的数据类型,我只简要的罗列下它们的区别。
区别1:指针只占4个字节,而数组将根据其长度占据一定的连续的空间。
区别2:虽然在表达式中数组名解释为指向数组中第一个元素的指针,但是用sizeof(数组名)得到的是整个数组的大小而不是4。
区别3:指针是可以修改的左值,而数组名是不可以修改的左值。
例:int a[10],b[10]; a=b;(非法)
注:左值是指编译时可知的用于存储结果的地方。右值是指直到运行时才知道的某个地址的内容。
区别4:定义一个字符指针并初始化一个字符串和定义一个数组并初始化一个字符串是不一样的。
例:char a[]=”abcdefg”; 和char *a=”abcdefg”;不一样。
前者是局部/全局(取决于定义的位置),后者存储于常量区,不能再修改。两者都以’\0’结束。
注:只有字符串常量才能在定义时给char *p赋值,其他类型的不行,例如int *p = 1; 错误
区别5:数组和指针访问元素的过程不一样。
由于数组的名字就是数组第一个元素的地址,而指针的名字是指针的地址,指针地址里的内容是数组首元素的地址,所以再用指针访问时会多一次间接寻址。
例:char a []="abcdefg"; char *p = a;则:
a[i]的访问方式是:先取i的值,再加上a,再在此地址中取值。
p[i]的访问方式是:先通过p的值取出a的值,再取i的值,再加上a,再在此地址中取值。
当我们把某个变量声明为数组时,它就会按照数组的方式存储,当我们在表达式中用到此数组名时,虽然它总是被解释为*(a+i)的形式,但此时编译知道a是数组名,它的值就是数组首元素的地址了,此时不需要间接寻址的。而对于指针,则会多一次间接寻址。
注:通过区别5,我们知道指针和数组在取值时的过程不一样。那么我们就不要指望在定义和使用时分别用指针和数组了。(此处不是只形式,而是指实质)比如,在一个文件中定义int a[20];而在另一个文件中声明extern int *a;不要指望后面这个a指针就是前面的数组,因为此时在前面一个文件中对a的引用时数组方式,而在后一个文件中对a的引用是指针方式,这两种方式不可能相等。
网友评论