前景
前两天一位Python程序员向笔者吐槽:“C++的声明看着真是太可怕了。”笔者一边回想着“int i;”一边奇怪的问:“没有啊,是不是你Python写多了不习惯声明?”似乎有些不服气的他拿出纸写下了他看见的那条“可怕的”声明:
const std::string
*(*(*(&foo)(std::vector<char>, unsigned))(std::vector<char>))[10] = func;
笔者看到这条声明后表示了十分理解这位朋友,初学C/C++时相信有不少人都会被这种声明唬住。不过其实在理解了规则后就可以十分快速地读出其意义并吐槽:谁没事会在程序里写这种声明?事实上如此复杂的声明在日常使用的频率很低,就算真的需要一般也不会这样一条直接写出来,因为太影响代码可读性了。笔者认为这样的声明只会出现在两个地方:一是C/C++教程中,二是一些公司的笔面试中。后者隐隐有一种“想要进来拼乐高,先得懂得造航母”的意思在,而想要学好C/C++界的造航母技术自然需要优秀的前者了。其中笔者曾经读过的《Pointers on C》、《Expert C Programming》、《C++ Primer》等对声明都有比较清晰的讲解,本文标题中“高级声明”就是来自《Pointers on C》。
下文笔者将以自己的理解去叙述C++里读高级声明的方法,并将在后文讲述上文那条声明的意义。正题中假设读者清楚声明的含义以及能读懂简单的变量(包括数组、指针)以及函数声明的意义。
正题
首先看几条简单声明:
int i1; //i1为int变量
int *pi1; //pi1为指针,指向int变量
int* pi2, i2; //pi2为指针,指向int变量;i2为int变量
int iarr[5]; //iarr是维度为5的数组,每个元素为int类型
int &ival = i1; //ival是引用,与i1绑定
int foo(); //foo为函数,返回值为int类型
第三条是笔者看过的C/C++书都有提到的,虽然说int与运算符*写在了一起,但其实后者只会参与距离它最近的表达式的运算,逗号之后的表达式与之无关,换句话说,这个*只参与了pi2的声明。写成如下的形式可能会清晰一些:
int *pi2, i2;
不仅*运算符,例子中运算符[]、&、()都只会参与一条声明表达式的运算。
如果一条声明中不止一个运算符参与运算,就要考虑运算符的优先级了。看以下声明:
/*
从标识符piarr开始与之最靠近
的运算符有*与[],因为运算符
[]的优先级比*高,故前者先参
与运算。最后可得出piarr为维
度为5的数组,数组元素为指向
int类型的指针
*/
int *piarr[5];
最先与标识符进行运算的运算符指定了标识符是数组,之后只需要套用理解简单声明的方式即可。用以下几条声明做一个练习:
int (*piarr)[5]; // piarr是一个指针,指向维度为5的数组,数组每个元素为int类型
int *foo(); // foo是一个函数,返回值为一个指针,指针指向int类型
int (*pfoo)(); // pfoo是一个指针,指向了一个函数,函数返回值为int类型
int (*&pval)[5] = piarr; //pval是一个引用,绑定了一个指针,
//指针指向维度为5的数组,数组每个元素为int类型
必须要注意,声明必须符合C/C++的规定,随手一写很有可能写出一条错误声明。下面一条声明:
int foo()[]; // 意义:foo是一个函数,返回值是一个数组,数组每个元素为int类型
我们可以将它的意义读出来,但从读出来的意义我们发现这是一条非法声明,因为函数返回值不能返回数组或者函数。以下来一个错误声明练习:
// 以下的声明全都不符合C/C++的规定
int foo()(); // 返回函数的函数
int foo[5](); // 存储函数的数组
int *foo()[]; // 返回存储int指针的函数
有了上面的理论,我们回头看开头那一句声明(有必要把它再写出来):
const std::string
*(*(*(&foo)(std::vector<char>, unsigned))(std::vector<char>))[10] = func;
从标识符foo开始第一个参加运算的是&,所以foo是一个引用,绑定了一个带两个参数的函数,函数返回一个指针,指针指向一个带一个参数的函数,函数的返回值是一个指针,指针指向一个维度为10的数组,数组元素为指针,指针指向const string。
在C++11引入了auto关键字后可以将func的声明与foo的声明写成如下形式:
auto func(std::vector<char>, unsigned)
-> const std::string*(*(*)(std::vector<char>))[10];
auto &foo = func;
前面也说过,这么复杂的声明笔者实在是想不到它的用处,就算真的用到也不可能这么写。C++提供了两种类型命名的办法可以加强代码可读性:typedef与using。typedef是C语言时代就有的关键字,using从C++11开始可用于类型的命名,typedef的使用就不举例了,这里用using尝试对上面的声明进行简化:
using new_ret_type = const std::string*(*(*)(std::vector<char>))[10];
auto func(std::vector<char>, unsigned) -> new_ret_type;
auto &foo = func;
现实编写代码中如此多层的类型一般会使用多个using或typedef提高该类型的易读性,阅读过STL源代码的朋友可能比较有体会。读者可以自行尝试提高上面new_ret_type类型的可读性。
后记
这将是笔者发布的第二篇博文。虽然说这篇以及第一篇都是C++的基础内容,但笔者认为这些是很多人会因为简单而忽略掉的内容。
即使现在连一条评论都没有,笔者也会坚持写下去(博文内容不限),十分感谢被强行拉来阅读的朋友提供的意见以及错误纠正;同时谢谢路过但喵了两眼的路人,谢谢!
网友评论