GeekBand STL 第三周

作者: bilinbilin | 来源:发表于2016-07-03 21:29 被阅读0次

1. STL概述

STL的一个重要特点是数据结构和算法的分离。尽管这是个简单的概念，但这种分离确实使得STL变得非常通用。例如，由于STL的sort()函数是完全通用的，你可以用它来操作几乎任何数据集合，包括链表，容器和数组。

Tips：STL算法作为模板函数提供。为了和其他组件相区别，在本书中STL算法以后接一对圆括弧的方式表示，例如sort()。

STL另一个重要特性是它不是面向对象的。为了具有足够通用性，STL主要依赖于模板而不是封装，继承和虚函数（多态性）——OOP的三个要素。你在STL中找不到任何明显的类继承关系。这好像是一种倒退，但这正好是使得STL的组件具有广泛通用性的底层特征。另外，由于STL是基于模板，内联函数的使用使得生成的代码短小高效。

Tips:确保在编译使用了STL的程序中至少要使用-O优化来保证内联扩展。

STL提供了大量的模板类和函数，可以在OOP和常规编程中使用。所有的STL的大约50个算法都是完全通用的，而且不依赖于任何特定的数据类型。下面的小节说明了三个基本的STL组件：

1）迭代器提供了访问容器中对象的方法。例如，可以使用一对迭代器指定list或vector中的一定范围的对象。迭代器就如同一个指针。事实上，C++的指针也是一种迭代器。但是，迭代器也可以是那些定义了operator*()以及其他类似于指针的操作符地方法的类对象。

2）容器是一种数据结构，如list，vector，和deques ，以模板类的方法提供。为了访问容器中的数据，可以使用由容器类输出的迭代器。

3）算法是用来操作容器中的数据的模板函数。例如，STL用sort()来对一个vector中的数据进行排序，用find()来搜索一个list中的对象。函数本身与他们操作的数据的结构和类型无关，因此他们可以在从简单数组到高度复杂容器的任何数据结构上使用。

2. 头文件

为了避免和其他头文件冲突， STL的头文件不再使用常规的.h扩展。为了包含标准的string类，迭代器和算法，用下面的指示符：#include #include #include

如果你查看STL的头文件，你可以看到象iterator.h和stl_iterator.h这样的头文件。由于这些名字在各种STL实现之间都可能不同，你应该避免使用这些名字来引用这些头文件。为了确保可移植性，使用相应的没有.h后缀的文件名。

3. 命名空间

你的编译器可能不能识别名字空间。名字空间就好像一个信封，将标志符封装在另一个名字中。标志符只在名字空间中存在，因而避免了和其他标志符冲突。例如，可能有其他库和程序模块定义了sort()函数，为了避免和STL地sort()算法冲突，STL的sort()以及其他标志符都封装在名字空间std中。STL的sort()算法编译为std::sort()，从而避免了名字冲突。尽管你的编译器可能没有实现名字空间，你仍然可以使用他们。为了使用STL，可以将下面的指示符插入到你的源代码文件中，典型地是在所有的#include指示符的后面加入：using namespace std;

4. 迭代器

迭代器提供对一个容器中的对象的访问方法，并且定义了容器中对象的范围。迭代器就如同一个指针。事实上，C++的指针也是一种迭代器。但是，迭代器不仅仅是指针，因此你不能认为他们一定具有地址值。例如，一个数组索引，也可以认为是一种迭代器。迭代器有各种不同的创建方法。程序可能把迭代器作为一个变量创建。

一个STL容器类可能为了使用一个特定类型的数据而创建一个迭代器。作为指针，必须能够使用*操作符类获取数据。你还可以使用其他数学操作符如++。典型的，++操作符用来递增迭代器，以访问容器中的下一个对象。如果迭代器到达了容器中的最后一个元素的后面，则迭代器变成past-the-end值。使用一个past-the-end值得指针来访问对象是非法的，就好像使用NULL或为初始化的指针一样。

Tips: STL不保证可以从一个迭代器来抵达另一个迭代器。例如，当对一个集合中的对象排序时，如果你在不同的结构中指定了两个迭代器，第二个迭代器无法从第一个迭代器抵达，此时程序注定要失败。这是STL灵活性的一个代价。STL不保证检测毫无道理的错误。

4.1 迭代器的类型

对于STL数据结构和算法，你可以使用五种迭代器。下面简要说明了这五种类型：

· Input iterators 提供对数据的只读访问。

· Output iterators 提供对数据的只写访问

· Forward iterators 提供读写操作，并能向前推进迭代器。

· Bidirectional iterators提供读写操作，并能向前和向后操作。

· Random access iterators提供读写操作，并能在数据中随机移动。

尽管各种不同的STL实现细节方面有所不同，还是可以将上面的迭代器想象为一种类继承关系。从这个意义上说，下面的迭代器继承自上面的迭代器。由于这种继承关系，你可以将一个Forward迭代器作为一个output或input迭代器使用。同样，如果一个算法要求是一个bidirectional 迭代器，那么只能使用该种类型和随机访问迭代器。

4.2 指针迭代器

正如下面的小程序显示的，一个指针也是一种迭代器。该程序同样显示了STL的一个主要特性——它不只是能够用于它自己的类类型，而且也能用于任何C或C++类型。例子见原链接。iterdemo.cpp

Tips: 必须记住STL使用的是模板。因此，STL函数自动根据它们使用的数据类型来构造。

4.3 容器迭代器

尽管C++指针也是迭代器，但用的更多的是容器迭代器。容器迭代器用法和iterdemo.cpp一样，与将迭代器申明为指针变量不同的是，你可以使用容器类方法来获取迭代器对象。两个典型的容器类方法是begin()和end()。它们在大多数容器中表示整个容器范围。其他一些容器还使用rbegin()和rend()方法提供反向迭代器，以按反向顺序指定对象范围。下面的程序创建了一个矢量容器（STL的和数组等价的对象），并使用迭代器在其中搜索。该程序和前一章中的程序相同。Listing 2. vectdemo.cpp

4.4 常量迭代器

和指针一样，你可以给一个迭代器赋值。例如，首先申明一个迭代器：vector::iterator first;该语句创建了一个vector类的迭代器。下面的语句将该迭代器设置到intVector的第一个对象，并将它指向的对象值设置为123，first = intVector.begin();*first = 123;这种赋值对于大多数容器类都是允许的，除了只读变量。

5 使用迭代器编程

你已经见到了迭代器的一些例子，现在我们将关注每种特定的迭代器如何使用。由于使用迭代器需要关于STL容器类和算法的知识，在阅读了后面的两章后你可能需要重新复习一下本章内容。

5.1输入迭代器

输入迭代器是最普通的类型。输入迭代器至少能够使用==和!=测试是否相等；使用*来访问数据；使用++操作来递推迭代器到下一个元素或到达past-the-end 值。为了理解迭代器和STL函数是如何使用它们的，现在来看一下find()模板函数的定义：template InputIterator find( InputIterator first, InputIterator last, const T& value) { while (first != last && *first != value) ++first; return first; }注意在find()算法中，注意如果first和last指向不同的容器，该算法可能陷入死循环。

5.2 输出迭代器

输出迭代器缺省只写，通常用于将数据从一个位置拷贝到另一个位置。由于输出迭代器无法读取对象，因此你不会在任何搜索和其他算法中使用它。要想读取一个拷贝的值，必须使用另一个输入迭代器（或它的继承迭代器）。Listing 3. outiter.cpp

5.3 前推迭代器

前推迭代器能够读写数据值，并能够向前推进到下一个值。但是没法递减。replace()算法显示了前推迭代器的使用方法。template void replace (ForwardIterator first, ForwardIterator last, const T& old_value, const T& new_value);使用replace()将[first,last]范围内的所有值为old_value的对象替换为new_value。:replace(vdouble.begin(), vdouble.end(), 1.5, 3.14159);

5.4双向迭代器

双向迭代器要求能够增减。如reverse()算法要求两个双向迭代器作为参数:template void reverse (BidirectionalIterator first, BidirectionalIterator last);使用reverse()函数来对容器进行逆向排序:reverse(vdouble.begin(), vdouble.end());

5.5随机访问迭代器

随机访问迭代器能够以任意顺序访问数据，并能用于读写数据（不是const的C++指针也是随机访问迭代器）。STL的排序和搜索函数使用随机访问迭代器。随机访问迭代器可以使用关系操作符作比较。random_shuffle() 函数随机打乱原先的顺序。申明为：template void random_shuffle (RandomAccessIterator first, RandomAccessIterator last);使用方法：random_shuffle(vdouble.begin(), vdouble.end());

6. 迭代器技术

要学会使用迭代器和容器以及算法，需要学习下面的新技术。

6.1 流和迭代器

本书的很多例子程序使用I/O流语句来读写数据。对于迭代器，有另一种方法使用流和标准函数。理解的要点是将输入/输出流作为容器看待。因此，任何接受迭代器参数的算法都可以和流一起工作。Listing 4. outstrm.cpp

6.2 插入迭代器

插入迭代器用于将值插入到容器中。它们也叫做适配器，因为它们将容器适配或转化为一个迭代器，并用于copy()这样的算法中。例如，一个程序定义了一个链表和一个矢量容器:list dList;vector dVector;通过使用front_inserter迭代器对象，可以只用单个copy()语句就完成将矢量中的对象插入到链表前端的操作：copy(dVector.begin(), dVector.end(), front_inserter(dList));

三种插入迭代器如下：

· inserters 普通插入器将对象插入到容器任何对象的前面。

· Front inserters 将对象插入到数据集的前面——例如，链表表头。

· Back inserters 将对象插入到集合的尾部——例如，矢量的尾部，导致矢量容器扩展。如果出现past-the-end 则默认插入尾部。

使用插入迭代器可能导致容器中的其他对象移动位置，因而使得现存的迭代器非法。例如，将一个对象插入到矢量容器将导致其他值移动位置以腾出空间。一般来说，插入到象链表这样的结构中更为有效，因为它们不会导致其他对象移动。Listing 5. insert.cpp

6.3混合迭代器

函数在涉及到容器和算法的操作中，还有两个迭代器函数非常有用：

· advance() 按指定的数目增减迭代器。

· distance() 返回到达一个迭代器所需（递增）操作的数目。

advance()函数接受两个参数。第二个参数是向前推进的数目。对于前推迭代器，该值必须为正，而对于双向迭代器和随机访问迭代器，该值可以为负。使用 distance()函数来返回到达另一个迭代器所需要的步骤。注意distance()函数是迭代的，也就是说，它递增第三个参数。因此，你必须初始化该参数。未初始化该参数几乎注定要失败。

7. 函数和函数对象

STL中，函数被称为算法，也就是说它们和标准C库函数相比，它们更为通用。STL算法通过重载operator()函数实现为模板类或模板函数。这些类用于创建函数对象，对容器中的数据进行各种各样的操作。下面的几节解释如何使用函数和函数对象。

7.1 函数和断言

经常需要对容器中的数据进行用户自定义的操作。例如，你可能希望遍历一个容器中所有对象的STL算法能够回调自己的函数。所谓断言函数，就是返回bool值的函数。

7.2 函数对象

除了给STL算法传递一个回调函数，你还可能需要传递一个类对象以便执行更复杂的操作。这样的一个对象就叫做函数对象。实际上函数对象就是一个类，但它和回调函数一样可以被回调。例如，在函数对象每次被for_each()或find_if()函数调用时可以保留统计信息。函数对象是通过重载operator()()实现的。如果TanyClass定义了opeator()(),那么就可以这么使用：TAnyClass object; // Construct objectobject(); // Calls TAnyClass::operator()() functionfor_each(v.begin(), v.end(), object);

STL定义了几个函数对象。由于它们是模板，所以能够用于任何类型，包括C/C++固有的数据类型，如long。有些函数对象从名字中就可以看出它的用途，如plus()和multiplies()。类似的greater()和less-equal()用于比较两个值。

Tips: 有些版本的ANSI C++定义了times()函数对象，而GNU C++把它命名为multiplies()。使用时必须包含头文件。一个有用的函数对象的应用是accumulate() 算法。该函数计算容器中所有值的总和。记住这样的值不一定是简单的类型，通过重载operator+()，也可以是类对象。Listing 8. accum.cpp

引言：如果你想深入了解STL到底是怎么实现的，最好的办法是写个简单的程序，将程序中涉及到的模板源码给copy下来，稍作整理，就能看懂了。所以没有必要去买什么《STL源码剖析》之类的书籍，那些书可能反而浪费时间。』

7.2.1 发生器函数对象

有一类有用的函数对象是“发生器”(generator)。这类函数有自己的内存，也就是说它能够从先前的调用中记住一个值。例如随机数发生器函数。普通的C程序员使用静态或全局变量 “记忆”上次调用的结果。但这样做的缺点是该函数无法和它的数据相分离『还有个缺点是要用TLS才能线程安全』。显然，使用类来封装一块：“内存”更安全可靠。先看一下例子：Listing 9. randfunc.cpp

关于常量引用的一点小麻烦（不翻译了，VC下将例子中的const去掉）发生器函数类对象下面的例子说明发生器函数类对象的使用。Listing 10. fiborand.cpp该程序用完全不通的方法使用使用rand_shuffle。Fibonacci 发生器封装在一个类中，该类能从先前的“使用”中记忆运行结果。在本例中，类FiboRand 维护了一个数组和两个索引变量I和j。FiboRand类继承自unary_function() 模板:template class FiboRand : public unary_function {...Arg是用户自定义数据类型。该类还定以了两个成员函数，一个是构造函数，另一个是operator()（）函数，该操作符允许random_shuffle()算法象一个函数一样“调用”一个FiboRand对象。

7.2.2 绑定器函数对象

一个绑定器使用另一个函数对象f()和参数值V创建一个函数对象。被绑定函数对象必须为双目函数，也就是说有两个参数,A和B。STL 中的绑定器有：

· bind1st() 创建一个函数对象，该函数对象将值V作为第一个参数A。

· bind2nd()创建一个函数对象，该函数对象将值V作为第二个参数B。

举例如下：Listing 11. binder.cpp#include #include #include #include using namespace std; // Dataint iarray[10] = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};list aList(iarray, iarray + 10); int main(){ int k = 0; count_if(aList.begin(), aList.end(), bind1st(greater(), 8), k); cout << "Number elements < 8 == " << k << endl; return 0;}Algorithm count_if()计算满足特定条件的元素的数目。这是通过将一个函数对象和一个参数捆绑到为一个对象，并将该对象作为算法的第三个参数实现的。注意这个表达式:bind1st(greater(), 8)该表达式将greater()和一个参数值8捆绑为一个函数对象。由于使用了bind1st()，所以该函数相当于计算下述表达式：8 > q表达式中的q是容器中的对象。因此，完整的表达式count_if(aList.begin(), aList.end(), bind1st(greater(), 8), k);计算所有小于或等于8的对象的数目。

7.2.3 否定函数对象

所谓否定(negator)函数对象，就是它从另一个函数对象创建而来，如果原先的函数返回真，则否定函数对象返回假。有两个否定函数对象：not1()和not2()。not1()接受单目函数对象，not2()接受双目函数对象。否定函数对象通常和绑定器一起使用。例如，上节中用bind1nd来搜索q<=8的值： count_if(aList.begin(), aList.end(), bind1st(greater(), 8), k);如果要搜索q>8的对象，则用bind2st。而现在可以这样写：start = find_if(aList.begin(), aList.end(),

not1(bind1nd(greater(), 6)));你必须使用not1，因为bind1nd返回单目函数。

8. 总结

使用标准模板库 (STL)尽管很多程序员仍然在使用标准C函数，但是这就好像骑着毛驴寻找Mercedes一样。你当然最终也会到达目标，但是你浪费了很多时间。尽管有时候使用标准C函数确实方便(如使用sprintf()进行格式化输出)。但是C函数不使用异常机制来报告错误，也不适合处理新的数据类型。而且标准C函数经常使用内存分配技术，没有经验的程序员很容易写出bug来。.C++标准库则提供了更为安全，更为灵活的数据集处理方式。STL最初由HP实验室的Alexander Stepanov和Meng Lee开发。最近，C++标准委员会采纳了STL，尽管在不同的实现之间仍有细节差别。STL的最主要的两个特点：数据结构和算法的分离，非面向对象本质。访问对象是通过象指针一样的迭代器实现的；容器是象链表，矢量之类的数据结构，并按模板方式提供；算法是函数模板，用于操作容器中的数据。由于STL以模板为基础，所以能用于任何数据类型和结构。

GeekBand STL 第三周

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读