1、C+ STL 速成这是本小人书。原名是using stl,不知道是谁写的。不过我倒觉得很有趣,所以化了两个晚上把它翻译出来。我没有对翻译出来的内容校验过。如果你没法在三十分钟内觉得有所收获,那么赶紧扔了它。文中我省略了很多东西。心疼那,浪费我两个晚上。译者:karycontact:STL 概述STL 的一个重要特点是数据结构和算法的分离。尽管这是个简单的概念,但这种分离确实使得 STL 变得非常通用。例如,由于 STL 的 sort()函数是完全通用的,你可以用它来操作几乎任何数据集合,包括链表,容器和数组。要点STL 算法作为模板函数提供。为了和其他组件相区别,在本书中 STL 算法以后接一
2、对圆括弧的方式表示,例如 sort()。STL 另一个重要特性是它不是面向对象的。为了具有足够通用性,STL 主要依赖于模板而不是封装,继承和虚函数(多态性)OOP 的三个要素。你在 STL中找不到任何明显的类继承关系。这好像是一种倒退,但这正好是使得 STL 的组件具有广泛通用性的底层特征。另外,由于 STL 是基于模板,内联函数的使用使得生成的代码短小高效。提示确保在编译使用了 STL 的程序中至少要使用-O 优化来保证内联扩展。STL 组件STL 提供了大量的模板类和函数,可以在 OOP 和常规编程中使用。所有的 STL的大约 50 个算法都是完全通用的,而且不依赖于任何特定的数据类型。
3、下面的小节说明了三个基本的 STL 组件:1)迭代器提供了访问容器中对象的方法。例如,可以使用一对迭代器指定list 或 vector 中的一定范围的对象。迭代器就如同一个指针。事实上,C+的指 针也是一种迭代器。但是,迭代器也可以是那些定义了 operator*()以及其他类似于指针的操作符地方法的类对象。2)容器是一种数据结构,如 list,vector,和 deques ,以模板类的方法提供。为了访问容器中的数据,可以使用由容器类输出的迭代器。3)算法是用来操作容器中的数据的模板函数。例如,STL 用 sort()来对一个vector 中的数据进行排序,用 find()来搜索一个 lis
4、t 中的对象。 函数本身与他们操作的数据的结构和类型无关,因此他们可以在从简单数组到高度复杂容器的任何数据结构上使用。头文件为了避免和其他头文件冲突, STL 的头文件不再使用常规的.h 扩展。为了包含标准的 string 类,迭代器和算法,用下面的指示符:#include #include #include 如果你查看 STL 的头文件,你可以看到象 iterator.h 和 stl_iterator.h 这样的头文件。由于这些名字在各种 STL 实现之间都可 能不同,你应该避免使用这些名字来引用这些头文件。为了确保可移植性,使用相应的没有.h 后缀的文件名。表 1 列出了最常使用的各种容器
5、类的头文件。该表并 不完整,对于其他头文件,我将在本章和后面的两章中介绍。表 1. STL 头文件和容器类#include Container Classdequelistmap, multimapqueue, priority_queueset, multisetstackvector, vector名字空间你的编译器可能不能识别名字空间。名字空间就好像一个信封,将标志符封装在另一个名字中。标志符只在名字空间中存在,因而避免了和其他标志符冲突。例如,可能有其他库和程序模块定义了 sort()函数,为了避免和 STL 地 sort()算法冲突,STL 的 sort()以及其他标志符都封装在名字
6、空间 std 中。STL 的sort()算法编译为 std:sort(),从而避免了名字冲突。尽管你的编译器可能没有实现名字空间,你仍然可以使用他们。为了使用STL,可以将下面的指示符插入到你的源代码文件中,典型地是在所有的#include 指示符的后面:using namespace std;迭代器迭代器提供对一个容器中的对象的访问方法,并且定义了容器中对象的范围。迭代器就如同一个指针。事实上,C+的指针也是一种迭代器。但是,迭代器不仅仅是指针,因此你不能认为他们一定具有地址值。例如,一个数组索引,也可以认为是一种迭代器。迭代器有各种不同的创建方法。程序可能把迭代器作为 一个变量创建。一个S
7、TL 容器类可能为了使用一个特定类型的数据而创建一个迭代器。作为指针,必须能够使用*操作符类获取数据。你还可以使用其他数学操作 符如+。典型的,+操作符用来递增迭代器,以访问容器中的下一个对象。如果迭代器到达了容器中的最后一个元素的后面,则迭代器变成 past-the- end 值。使用一个past-the-end 值得指针来访问对象是非法的,就好像使用 NULL 或为初始化的指针一样。提示STL 不保证可以从另一个迭代器来抵达一个迭代器。例如,当对一个集合中的对象排序时,如果你在不同的结构中指定了两个迭代器,第二个迭代器无法从第一个迭代器抵达,此时程序注定要失败。这是 STL 灵活性的一个代
8、价。STL不保证检测毫无道理的错误。迭代器的类型对于 STL 数据结构和算法,你可以使用五种迭代器。下面简要说明了这五种类型: Input iterators 提供对数据的只读访问。 Output iterators 提供对数据的只写访问 Forward iterators 提供读写操作,并能向前推进迭代器。 Bidirectional iterators 提供读写操作,并能向前和向后操作。 Random access iterators 提供读写操作,并能在数据中随机移动。尽管各种不同的 STL 实现细节方面有所不同,还是可以将上面的迭代器想象为一种类继承关系。从这个意义上说,下面的迭代器继
9、承自上面的迭代器。由于 这种继承关系,你可以将一个 Forward 迭代器作为一个 output 或 input 迭代器使用。同样,如果一个算法要求是一个 bidirectional 迭代器,那么只能使用该种类型和随机访问迭代器。 指针迭代器正如下面的小程序显示的,一个指针也是一种迭代器。该程序同样显示了 STL的一个主要特性它不只是能够用于它自己的类类型,而且也能用于任何 C或 C+类型。Listing 1, iterdemo.cpp, 显示了如何把指针作为迭代器用于STL 的 find()算法来搜索普通的数组。表 1. iterdemo.cpp #include #include usin
10、g namespace std;#define SIZE 100int iarraySIZE;int main()iarray20 = 50;int* ip = find(iarray, iarray + SIZE, 50);if (ip = iarray + SIZE)cout #include #include using namespace std;vector intVector(100);void main()intVector20 = 50;vector:iterator intIter =find(intVector.begin(), intVector.end(), 50);i
11、f (intIter != intVector.end()cout :iterator first;该语句创建了一个 vector类的迭代器。下面的语句将该迭代器设置到intVector 的第一个对象,并将它指向的对象值设置为 123::first = intVector.begin();*first = 123;这种赋值对于大多数容器类都是允许的,除了只读变量。为了防止错误赋值,可以申明迭代器为:const vector:iterator result;result = find(intVector.begin(), intVector.end(), value);if (result !=
12、 intVector.end()*result = 123; / ?警告另一种防止数据被改变得方法是将容器申明为 const 类型。呀!在 VC 中测试出错,正确的含义是 result 成为常量而不是它指向的对象不允许改变,如同 int *const p;看来这作者自己也不懂 使用迭代器编程你已经见到了迭代器的一些例子,现在我们将关注每种特定的迭代器如何使用。由于使用迭代器需要关于 STL 容器类和算法的知识,在阅读了后面的两章后你可能需要重新复习一下本章内容。输入迭代器输入迭代器是最普通的类型。输入迭代器至少能够使用=和!=测试是否相等;使用*来访问数据;使用+操作来递推迭代器到下一个元素或
13、到达 past-the-end 值。为了理解迭代器和 STL 函数是如何使用它们的,现在来看一下 find()模板函数的定义:template InputIterator find(InputIterator first, InputIterator last, const Treturn first;注意在 find()算法中,注意如果 first 和 last 指向不同的容器,该算法可能陷入死循环。输出迭代器输出迭代器缺省只写,通常用于将数据从一个位置拷贝到另一个位置。由于输出迭代器无法读取对象,因此你不会在任何搜索和其他算法中使用它。要想读取一个拷贝的值,必须使用另一个输入迭代器(或它的
14、继承迭代器)。Listing 3. outiter.cpp #include #include / Need copy()#include / Need vectorusing namespace std;double darray10 =1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9;vector vdouble(10);int main()vector:iterator outputIterator = vdouble.begin();copy(darray, darray + 10, outputIterator);while (outp
15、utIterator != vdouble.end() cout void replace (ForwardIterator first,ForwardIterator last,const T使用 replace()将first,last范围内的所有值为 old_value 的对象替换为new_value。:replace(vdouble.begin(), vdouble.end(), 1.5, 3.14159);双向迭代器双向迭代器要求能够增减。如 reverse()算法要求两个双向迭代器作为参数:template void reverse (BidirectionalIterator f
16、irst,BidirectionalIterator last);使用 reverse()函数来对容器进行逆向排序:reverse(vdouble.begin(), vdouble.end();随机访问迭代器随机访问迭代器能够以任意顺序访问数据,并能用于读写数据(不是 const 的C+指针也是随机访问迭代器)。STL 的排序和搜索函数使用随机访问迭代器。随机访问迭代器可以使用关系操作符作比较。random_shuffle() 函数随机打乱原先的顺序。申明为:template void random_shuffle (RandomAccessIterator first,RandomAcces
17、sIterator last);使用方法:random_shuffle(vdouble.begin(), vdouble.end();迭代器技术要学会使用迭代器和容器以及算法,需要学习下面的新技术。流和迭代器本书的很多例子程序使用 I/O 流语句来读写数据。例如:int value;cout value;cout #include / Need random(), srandom()#include / Need time()#include / Need sort(), copy()#include / Need vectorusing namespace std;void Display(
18、vectorint main()/ Seed the random number generatorsrandom( time(NULL) );/ Construct vector and fill with random integer valuesvector collection(10);for (int i = 0; i cout (cout, “t“);第三个参数实例化了 ostream_iterator类型,并将它作为 copy()函数的输出目标迭代器对象。“t”字符串是作为分隔符。运行结果:$ g+ outstrm.cpp$ ./a.outBefore sorting677 72
19、2 686 238 964 397 251 118 11 312After sorting11 118 238 251 312 397 677 686 722 964这是 STL 神奇的一面确实神奇。为定义输出流迭代器,STL 提供了模板类ostream_iterator。这个类的构造函数有两个参数:一个 ostream 对象和一个string 值。因此可以象下面一样简单地创建一个迭代器对象:ostream_iterator(cout, “n“)该迭代起可以和任何接受一个输出迭代器的函数一起使用。插入迭代器插入迭代器用于将值插入到容器中。它们也叫做适配器,因为它们将容器适配或转化为一个迭代器,
20、并用于 copy()这样的算法中。例如,一个程序定义了一个链表和一个矢量容器:list dList;vector dVector;通过使用 front_inserter 迭代器对象,可以只用单个 copy()语句就完成将矢量中的对象插入到链表前端的操作:copy(dVector.begin(), dVector.end(), front_inserter(dList);三种插入迭代器如下: 普通插入器 将对象插入到容器任何对象的前面。 Front inserters 将对象插入到数据集的前面例如,链表表头。 Back inserters 将对象插入到集合的尾部例如,矢量的尾部,导致矢量容器扩展
21、。使用插入迭代器可能导致容器中的其他对象移动位置,因而使得现存的迭代器非法。例如,将一个对象插入到矢量容器将导致其他值移动位置以腾出空间。一般来说,插入到象链表这样的结构中更为有效,因为它们不会导致其他对象移动。Listing 5. insert.cpp #include #include #include using namespace std;int iArray5 = 1, 2, 3, 4, 5 ;void Display(listint main()list iList;/ Copy iArray backwards into iListcopy(iArray, iArray + 5,
22、 front_inserter(iList);Display(iList, “Before find and copy“);/ Locate value 3 in iListlist:iterator p =find(iList.begin(), iList.end(), 3);/ Copy first two iArray values to iList ahead of pcopy(iArray, iArray + 2, inserter(iList, p);Display(iList, “After find and copy“);return 0;void Display(listco
23、ut iList;list:iterator p =find(iList.begin(), iList.end(), 2);cout #include / Need random(), srandom()#include / Need time()#include / Need vector#include / Need for_each()#define VSIZE 24 / Size of vectorvector v(VSIZE); / Vector object/ Function prototypesvoid initialize(long void show(const long
24、bool isMinus(const long / Predicate functionint main()srandom( time(NULL) ); / Seed random generatorfor_each(v.begin(), v.end(), initialize);/调用普通函数cout :iterator p;p = find_if(v.begin(), v.end(), isMinus);/调用断言函数while (p != v.end() count+;p = find_if(p + 1, v.end(), isMinus);cout 。一个有用的函数对象的应用是 acc
25、umulate() 算法。该函数计算容器中所有值的总和。记住这样的值不一定是简单的类型,通过重载 operator+(),也可以是类对象。Listing 8. accum.cpp #include #include / Need accumulate()#include / Need vector#include / Need multiplies() (or times()#define MAX 10vector v(MAX); / Vector objectint main()/ Fill vector using conventional loop/for (int i = 0; i (
26、);/注意这行cout inline_Ty accumulate(_II _F, _II _L, _Ty _V)for (; _F != _L; +_F)_V = _V + *_F;return (_V); / TEMPLATE FUNCTION accumulate WITH BINOPtemplate inline_Ty accumulate(_II _F, _II _L, _Ty _V, _Bop _B)for (; _F != _L; +_F)_V = _B(_V, *_F);return (_V); / TEMPLATE STRUCT binary_functiontemplates
27、truct binary_function typedef _A1 first_argument_type;typedef _A2 second_argument_type;typedef _R result_type;/ TEMPLATE STRUCT multipliestemplatestruct multiplies : binary_function _Ty operator()(const _Ty ;引言:如果你想深入了解 STL 到底是怎么实现的,最好的办法是写个简单的程序,将程序中涉及到的模板源码给 copy 下来,稍作整理,就能看懂了。所以没有必要去买什么STL 源码剖析之类
28、的书籍,那些书可能反而浪费时间。发生器函数对象有一类有用的函数对象是“发生器”(generator)。这类函数有自己的内存,也就是说它能够从先前的调用中记住一个值。例如随机数发生器函数。普通的 C 程序员使用静态或全局变量 “记忆”上次调用的结果。但这样做的缺点是该函数无法和它的数据相分离还有个缺点是要用 TLS 才能线程安全。显然,使用类来封装一块:“内存”更安全可靠。先看一下例子:Listing 9. randfunc.cpp #include #include / Need random(), srandom()#include / Need time()#include / Need
29、random_shuffle()#include / Need vector#include / Need ptr_fun()using namespace std;/ Data to randomizeint iarray10 = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10;vector v(iarray, iarray + 10);/ Function prototypesvoid Display(vectorunsigned int RandInt(const unsigned int n);int main()srandom( time(NULL) ); / Seed
30、random generatorDisplay(v, “Before shuffle:“);pointer_to_unary_functionptr_RandInt = ptr_fun(RandInt); / Pointer to RandInt()/注意这行random_shuffle(v.begin(), v.end(), ptr_RandInt);Display(v, “After shuffle:“);return 0;/ Display contents of vector vrvoid Display(vectorcout ptr_RandInt = ptr_fun(RandInt
31、);这儿使用 STL 的单目函数模板定义了一个变量 ptr_RandInt,并将地址初始化到我们的函数 RandInt()。单目函数接受一个参数,并返回一个值。现在random_shuffle()可以如下调用:random_shuffle(v.begin(), v.end(), ptr_RandInt);在本例子中,发生器只是简单的调用 rand()函数。关于常量引用的一点小麻烦(不翻译了,VC 下将例子中的 const 去掉) 发生器函数类对象下面的例子说明发生器函数类对象的使用。Listing 10. fiborand.cpp #include #include / Need random
32、_shuffle()#include / Need vector#include / Need unary_functionusing namespace std;/ Data to randomizeint iarray10 = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10;vector v(iarray, iarray + 10);/ Function prototypevoid Display(vector/ The FiboRand template function-object classtemplate class FiboRand : public unary_f
33、unction int i, j;Arg sequence18;public:FiboRand();Arg operator()(const Arg;void main()FiboRand fibogen; / Construct generator objectcout cout FiboRand:FiboRand()sequence17 = 1;sequence16 = 2;for (int n = 15; n 0; n)sequencen = sequencen + 1 + sequencen + 2;i = 17;j = 5;/ FiboRand class function oper
34、atortemplateArg FiboRand:operator()(const Argsequencei = k;i-;j-;if (i = 0) i = 17;if (j = 0) j = 17;return k % arg;编译运行输出如下:$ g+ fiborand.cpp$ ./a.outFibonacci random number generatorusing random_shuffle and a function objectBefore shuffle:1 2 3 4 5 6 7 8 9 10After shuffle:6 8 5 4 3 7 10 1 9该程序用完全不
35、通的方法使用使用 rand_shuffle。Fibonacci 发生器封装在一个类中,该类能从先前的“使用”中记忆运行结果。在本例中,类 FiboRand 维护了一个数组和两个索引变量 I 和 j。FiboRand 类继承自 unary_function() 模板:template class FiboRand : public unary_function .Arg 是用户自定义数据类型。该类还定以了两个成员函数,一个是构造函数,另一个是 operator()()函数,该操作符允许 random_shuffle()算法象一个函数一样“调用”一个 FiboRand 对象。 绑定器函数对象一个绑
36、定器使用另一个函数对象 f()和参数值 V 创建一个函数对象。被绑定函数对象必须为双目函数,也就是说有两个参数,A 和 B。STL 中的帮定器有: bind1st() 创建一个函数对象,该函数对象将值 V 作为第一个参数A。 bind2nd()创建一个函数对象,该函数对象将值 V 作为第二个参数B。举例如下:Listing 11. binder.cpp #include #include #include #include using namespace std;/ Dataint iarray10 = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10;list aList(iarr
37、ay, iarray + 10);int main()int k = 0;count_if(aList.begin(), aList.end(),bind1st(greater(), 8), k);cout (), 8)该表达式将 greater()和一个参数值 8 捆绑为一个函数对象。由于使用了bind1st(),所以该函数相当于计算下述表达式: 8 q表达式中的 q 是容器中的对象。因此,完整的表达式count_if(aList.begin(), aList.end(),bind1st(greater(), 8), k);计算所有小于或等于 8 的对象的数目。 否定函数对象所谓否定(neg
38、ator)函数对象,就是它从另一个函数对象创建而来,如果原先的函数返回真,则否定函数对象返回假。有两个 否定函数对象:not1()和 not2()。not1()接受单目函数对象,not2()接受双目函数对象。否定函数对象通常和帮定器一起使用。例如,上 节中用 bind1nd 来搜索 q(), 8), k);如果要搜索 q8 的对象,则用 bind2st。而现在可以这样写:start = find_if(aList.begin(), aList.end(), not1(bind1nd(greater(), 6);你须使用 not1,因为 bind1nd 返回单目函数。 总结:使用标准模板库 (S
39、TL)尽管很多程序员仍然在使用标准 C 函数,但是这就好像骑着毛驴寻找 Mercedes一样。你当然最终也会到达目标,但是你浪费了很多时间。尽管有时候使用标准 C 函数确实方便(如使用 sprintf()进行格式化输出)。但是 C 函数不使用异常机制来报告错误,也不适合处理新的数据类型。而且标准C 函数经常使用内存分配技术,没有经验的程序员很容易写出 bug 来。.C+标准库则提供了更为安全,更为灵活的数据集处理方式。STL 最初由 HP 实验室的 Alexander Stepanov 和 Meng Lee 开发。最近,C+标准委员会采纳了STL,尽管在不同的实现之间仍有细节差别。STL 的最主要的两个特点:数据结构和算法的分离,非面向对象本质。访问对象是通过象指针一样的迭代器实现的;容器是象链表,矢量之类的数据结构,并按模板方式提供;算法是函数模板,用于操作容器中的数据。由于 STL 以模板为基础,所以能用于任何数据类型和结构。