1、一、编程老手与高手的误区2高质量 C+/C 编程指南(硬封皮)文件标识:当前版本: 1.0作 者: 林锐 博士文件状态 草稿文件 正式文件 更改正式文件完成日期: 2001 年 7 月 24 日版 本 历 史(软封皮)版本/状态 作者 参与者 起止日期 备注V 0.9草稿文件林锐 2001-7-1 至2001-7-18林锐起草V 1.0正式文件林锐 2001-7-18 至2001-7-24朱洪海审查 V 0.9,林锐修正草稿中的错误1目录前 言 2一、编程老手与高手的误区 .3二、本书导读 .6三、版权声明 .71文件结构 81.1 版权和版本的声明 81.2 头文件的结构 81.3 定义文件
2、的结构 91.4 头文件的作用 101.5 目录结构 102 程序的版式 122.1 空行 122.2 代码行 132.3 代码行内的空格 132.4 对齐 142.5 长行拆分 152.6 修饰符的位置 162.7 注释 162.8 类的版式 1723 命名规则 193.1 共性规则 193.2 简单的 Windows 应用程序命名规则 203.3 简单的 Unix 应用程序命名规则 .224 表达式和基本语句 234.1 运算符的优先级 234.2 复合表达式 244.3 if 语句 .244.3.1 布尔变量与零值比较 244.3.2 整型变量与零值比较 254.3.3 浮点变量与零值比
3、较 254.3.4 指针变量与零值比较 254.3.5 对 if 语句的补充说明 .264.4 循环语句的效率 264.5 for 语句的循环控制变量 274.6 switch 语句 .274.7 goto 语句 .283前 言软件质量是被大多数程序员挂在嘴上而不是放在心上的东西!除了完全外行和真正的编程高手外,初读本书,你最先的感受将是惊慌:“哇!我以前捏造的 C+/C 程序怎么会有那么多的毛病?”别难过,作者只不过比你早几年、多几次惊慌而已。请花一两个小时认真阅读这本百页经书,你将会获益匪浅,这是前面 N-1 个读者的建议。4一、编程老手与高手的误区自从计算机问世以来,程序设计就成了令人羡
4、慕的职业,程序员在受人宠爱之后容易发展成为毛病特多却常能自我臭美的群体。如今在 Internet 上流传的“真正”的程序员据说是这样的:真正的程序员没有进度表,只有讨好领导的马屁精才有进度表,真正的程序员会让领导提心吊胆。真正的程序员不写使用说明书,用户应当自己去猜想程序的功能。真正的程序员几乎不写代码的注释,如果注释很难写,它理所当然也很难读。真正的程序员不画流程图,原始人和文盲才会干这事。真正的程序员不看参考手册,新手和胆小鬼才会看。真正的程序员不写文档也不需要文档,只有看不懂程序的笨蛋才用文档。真正的程序员认为自己比用户更明白用户需要什么。真正的程序员不接受团队开发的理念,除非他自己是头
5、头。真正的程序员的程序不会在第一次就正确运行,但是他们愿意守着机器进行若干个30 小时的调试改错。真正的程序员不会在上午 9:00 到下午 5:00 之间工作,如果你看到他在上午 9:00 工作,这表明他从昨晚一直干到现在。具备上述特征越多,越显得水平高,资格老。所以别奇怪,程序员的很多缺点竟然可以被当作优点来欣赏。就象在武侠小说中,那些独来独往、不受约束且带点邪气的高手最令人崇拜。我曾经也这样信奉,并且希望自己成为那样的“真正”的程序员,结果没有得到好下场。我从读大学到博士毕业十年来一直勤奋好学,累计编写了数十万行 C+/C 代码。有这样的苦劳和疲劳,我应该称得上是编程老手了吧?我开发的软件
6、都与科研相关(集成电路 CAD 和 3D 图形学领域) ,动辄数万行程序,技术复杂,难度颇高。这些软件频频获奖,有一个软件获得首届中国大学生电脑大赛软件展示一等奖。在 1995 年开发的一套图形软件库到 2000 年还有人买。罗列出这些“业绩” ,可以说明我算得上是编程高手了吧?可惜这种个人感觉不等于事实。读博期间我曾用一年时间开发了一个近 10 万行 C+代码的 3D 图形软件产品,我内心得意表面谦虚地向一位真正的软件高手请教。他虽然从未涉足过 3D 图形领域,却在几十分钟内指出该软件多处重大设计错误。让人感觉那套软件是用纸糊的华丽衣服,扯一下掉一块,戳一下破个洞。我目瞪口呆地意识到这套软件
7、毫无实用价值,一年的一、编程老手与高手的误区5心血白化了,并且害死了自己的软件公司。人的顿悟通常发生在最心痛的时刻,在沮丧和心痛之后,我作了深刻反省, “面壁”半年,重新温习软件设计的基础知识。补修“内功”之后,又觉得腰板硬了起来。博士毕业前半年,我曾到微软中国研究院找工作,接受微软公司一位资深软件工程师的面试。他让我写函数 strcpy 的代码。太容易了吧?错!这么一个小不点的函数,他从三个方面考查:(1)编程风格;(2)出错处理;(3)算法复杂度分析(用于提高性能) 。在大学里从来没有人如此严格地考查过我的程序。我化了半个小时,修改了数次,他还不尽满意,让我回家好好琢磨。我精神抖擞地进“考
8、场” ,大汗淋漓地出“考场” 。这“高手”当得也太窝囊了。我又好好地反省了一次。我把反省后的心得体会写成文章放在网上传阅,引起了不少软件开发人员的共鸣。我因此有幸和国产大型 IT 企业如华为、上海贝尔、中兴等公司的同志们广泛交流。大家认为提高质量与生产率是软件工程要解决的核心问题。高质量程序设计是非常重要的环节,毕竟软件是靠编程来实现的。我们心目中的老手们和高手们能否编写出高质量的程序来?不见得都能!就我的经历与阅历来看,国内大学的计算机教育压根就没有灌输高质量程序设计的观念,教师们和学生们也很少自觉关心软件的质量。勤奋好学的程序员长期在低质量的程序堆中滚爬,吃尽苦头之后才有一些心得体会,长进
9、极慢,我就是一例。现在国内 IT 企业拥有学士、硕士、博士文凭的软件开发人员比比皆是,但他们在接受大学教育时就“先天不足” ,岂能一到企业就突然实现质的飞跃。试问有多少软件开发人员对正确性、健壮性、可靠性、效率、易用性、可读性(可理解性) 、可扩展性、可复用性、兼容性、可移植性等质量属性了如指掌?并且能在实践中运用自如?。 “高质量”可不是干活小心点就能实现的!我们有充分的理由疑虑:(1)编程老手可能会长期用隐含错误的方式编程(习惯成自然) ,发现毛病后都不愿相信那是真的!(2)编程高手可以在某一领域写出极有水平的代码,但未必能从全局把握软件质量的方方面面。6事实证明如此。我到上海贝尔工作一年
10、来,陆续面试或测试过近百名“新” “老”程序员的编程技能,质量合格率大约是 10。很少有人能够写出完全符合质量要求的 if 语句,很多程序员对指针、内存管理一知半解,。领导们不敢相信这是真的。我做过现场试验:有一次部门新进 14 名硕士生,在开欢迎会之前对他们进行“C+/C 编程技能”摸底考试。我问大家试题难不难?所有的人都回答不难。结果没有一个人及格,有半数人得零分。竞争对手公司的朋友们也做过试验,同样一败涂地。真的不是我“心狠手辣”或者要求过高,而是很多软件开发人员对自己的要求不够高。要知道华为、上海贝尔、中兴等公司的员工素质在国内 IT 企业中是比较前列的,倘若他们的编程质量都如此差的话
11、,我们怎么敢期望中小公司拿出高质量的软件呢?连程序都编不好,还谈什么振兴民族软件产业,岂不胡扯。我打算定义编程老手和编程高手,请您别见笑。定义 1:能长期稳定地编写出高质量程序的程序员称为编程老手。定义 2:能长期稳定地编写出高难度、高质量程序的程序员称为编程高手。根据上述定义,马上得到第一推论:我既不是高手也算不上是老手。在写此书前,我阅读了不少程序设计方面的英文著作,越看越羞惭。因为发现自己连编程基本技能都未能全面掌握,顶多算是二流水平,还好意思谈什么老手和高手。希望和我一样在国内土生土长的程序员朋友们能够做到:(1)知错就改;(2)经常温故而知新;(3)坚持学习,天天向上。二、本书导读7
12、二、本书导读首先请做附录 B 的 C+/C 试题(不要看答案) ,考查自己的编程质量究竟如何。然后参照答案严格打分。(1)如果你只得了几十分,请不要声张,也不要太难过。编程质量差往往是由于不良习惯造成的,与人的智力、能力没有多大关系,还是有药可救的。成绩越差,可以进步的空间就越大,中国不就是在落后中赶超发达资本主义国家吗?只要你能下决心改掉不良的编程习惯,第二次考试就能及格了。(2)如果你考及格了,表明你的技术基础不错,希望你能虚心学习、不断进步。如果你还没有找到合适的工作单位,不妨到上海贝尔试一试。(3)如果你考出 85 分以上的好成绩,你有义务和资格为你所在的团队作“C+/C 编程”培训。
13、希望你能和我们多多交流、相互促进。半年前我曾经发现一颗好苗子,就把他挖到我们小组来。(4)如果你在没有任何提示的情况下考了满分,希望你能收我做你的徒弟。编程考试结束后,请阅读本书的正文。本书第一章至第六章主要论述 C+/C 编程风格。难度不高,但是细节比较多。别小看了,提高质量就是要从这些点点滴滴做起。世上不存在最好的编程风格,一切因需求而定。团队开发讲究风格一致,如果制定了大家认可的编程风格,那么所有组员都要遵守。如果读者觉得本书的编程风格比较合你的工作,那么就采用它,不要只看不做。人在小时候说话发音不准,写字潦草,如果不改正,总有后悔的时候。编程也是同样道理。第七章至第十一章是专题论述,技
14、术难度比较高,看书时要积极思考。特别是第七章“内存管理” ,读了并不表示懂了,懂了并不表示就能正确使用。有一位同事看了第七章后觉得“野指针”写得不错,与我切磋了一把。可是过了两周,他告诉我,他忙了两天追查出一个 Bug,想不到又是“野指针”出问题,只好重读第七章。光看本书对提高编程质量是有限的,建议大家阅读本书的参考文献,那些都是经典名著。如果你的编程质量已经过关了,不要就此满足。如果你想成为优秀的软件开发人员,建议你阅读并按照 CMMI 规范做事,让自己的综合水平上升一个台阶。上海贝尔的员工可以向网络应用事业部软件工程研究小组索取 CMMI 有关资料,最好能参加培训。三、版权声明8三、版权声
15、明本书的大部分内容取材于作者一年前的书籍手稿(尚未出版) ,现整理汇编成为上海贝尔网络应用事业部的一个规范化文件,同时作为培训教材。由于 C+/C 编程是众所周知的技术,没有秘密可言。编程的好经验应该大家共享,我们自己也是这么学来的。作者愿意公开本书的电子文档。版权声明如下:(1)读者可以任意拷贝、修改本书的内容,但不可以篡改作者及所属单位。(2)未经作者许可,不得出版或大量印发本书。(3)如果竞争对手公司的员工得到本书,请勿公开使用,以免发生纠纷。预计到 2002 年 7 月,我们将建立切合中国国情的 CMMI 3 级解决方案。届时,包括本书在内的约 1000 页规范将严格受控。欢迎读者对本
16、书提出批评建议。林锐,2001 年 7 月1文件结构91文件结构每个 C+/C 程序通常分为两个文件。一个文件用于保存程序的声明(declaration ) ,称为头文件。另一个文件用于保存程序的实现(implementation) ,称为定义(definition)文件。C+/C 程序的头文件以“.h”为后缀,C 程序的定义文件以 “.c”为后缀,C+程序的定义文件通常以“.cpp”为后缀(也有一些系统以“.cc”或“.cxx”为后缀) 。1.1 版权和版本的声明版权和版本的声明位于头文件和定义文件的开头(参见示例 1-1) ,主要内容有:(1)版权信息。(2)文件名称,标识符,摘要。(3)
17、当前版本号,作者/修改者,完成日期。(4)版本历史信息。/* Copyright (c) 2001,上海贝尔有限公司网络应用事业部* All rights reserved.* * 文件名称: filename.h* 文件标识: 见配置管理计划书* 摘 要: 简要描述本文件的内容* * 当前版本: 1.1* 作 者: 输入作者(或修改者)名字* 完成日期: 2001年 7月 20日* 取代版本:1.0 * 原作者 : 输入原作者(或修改者)名字* 完成日期: 2001年 5月 10日*/示例1-1 版权和版本的声明1.2 头文件的结构头文件由三部分内容组成:(1)头文件开头处的版权和版本声明(
18、参见示例 1-1) 。(2)预处理块。1文件结构10(3)函数和类结构声明等。假设头文件名称为 graphics.h,头文件的结构参见示例 1-2。 【规则 1-2-1】为了防止头文件被重复引用,应当用 ifndef/define/endif 结构产生预处理块。 【规则 1-2-2】用 #include 格式来引用标准库的头文件(编译器将从标准库目录开始搜索) 。 【规则 1-2-3】用 #include “filename.h” 格式来引用非标准库的头文件(编译器将从用户的工作目录开始搜索) 。 【建议 1-2-1】头文件中只存放“声明”而不存放“定义”在 C+ 语法中,类的成员函数可以在声
19、明的同时被定义,并且自动成为内联函数。这虽然会带来书写上的方便,但却造成了风格不一致,弊大于利。建议将成员函数的定义与声明分开,不论该函数体有多么小。 【建议 1-2-2】不提倡使用全局变量,尽量不要在头文件中出现象 extern int value 这类声明。/ 版权和版本声明见示例 1-1,此处省略。#ifndef GRAPHICS_H / 防止 graphics.h 被重复引用#define GRAPHICS_H#include / 引用标准库的头文件#include “myheader.h” / 引用非标准库的头文件void Function1();/ 全局函数声明class Box
20、/ 类结构声明;#endif示例 1-2 C+/C 头文件的结构1.3 定义文件的结构定义文件有三部分内容:(1) 定义文件开头处的版权和版本声明(参见示例 1-1) 。(2) 对一些头文件的引用。1文件结构10(3) 程序的实现体(包括数据和代码) 。假设定义文件的名称为 graphics.cpp,定义文件的结构参见示例 1-3。/ 版权和版本声明见示例 1-1,此处省略。#include “graphics.h” / 引用头文件/ 全局函数的实现体void Function1()/ 类成员函数的实现体void Box:Draw()示例 1-3 C+/C 定义文件的结构1.4 头文件的作用早
21、期的编程语言如 Basic、Fortran 没有头文件的概念,C+/C 语言的初学者虽然会用使用头文件,但常常不明其理。这里对头文件的作用略作解释:(1)通过头文件来调用库功能。在很多场合,源代码不便(或不准)向用户公布,只要向用户提供头文件和二进制的库即可。用户只需要按照头文件中的接口声明来调用库功能,而不必关心接口怎么实现的。编译器会从库中提取相应的代码。(2)头文件能加强类型安全检查。如果某个接口被实现或被使用时,其方式与头文件中的声明不一致,编译器就会指出错误,这一简单的规则能大大减轻程序员调试、改错的负担。1.5 目录结构如果一个软件的头文件数目比较多(如超过十个) ,通常应将头文件
22、和定义文件分别保存于不同的目录,以便于维护。例如可将头文件保存于 include 目录,将定义文件保存于 source 目录(可以是多级目录) 。如果某些头文件是私有的,它不会被用户的程序直接引用,则没有必要公开其“声明” 。为了加强信息隐藏,这些私有的头文件可以和定义文件存放于同一个目录。1文件结构102 程序的版式132 程序的版式版式虽然不会影响程序的功能,但会影响可读性。程序的版式追求清晰、美观,是程序风格的重要构成因素。可以把程序的版式比喻为“书法” 。好的“书法”可让人对程序一目了然,看得兴致勃勃。差的程序“书法”如螃蟹爬行,让人看得索然无味,更令维护者烦恼有加。请程序员们学习程序
23、的“书法” ,弥补大学计算机教育的漏洞,实在很有必要。2.1 空行空行起着分隔程序段落的作用。空行得体(不过多也不过少)将使程序的布局更加清晰。空行不会浪费内存,虽然打印含有空行的程序是会多消耗一些纸张,但是值得。所以不要舍不得用空行。 【规则 2-1-1】在每个类声明之后、每个函数定义结束之后都要加空行。参见示例2-1(a ) 【规则 2-1-2】在一个函数体内,逻揖上密切相关的语句之间不加空行,其它地方应加空行分隔。参见示例 2-1(b )/ 空行void Function1()/ 空行void Function2()/ 空行void Function3()/ 空行while (condi
24、tion)statement1;/ 空行if (condition) statement2;elsestatement3;/ 空行statement4; 示例 2-1(a) 函数之间的空行 示例 2-1(b) 函数内部的空行4 表达式和基本语句142.2 代码行 【规则 2-2-1】一行代码只做一件事情,如只定义一个变量,或只写一条语句。这样的代码容易阅读,并且方便于写注释。 【规则 2-2-2】if、for、while、do 等语句自占一行,执行语句不得紧跟其后。不论执行语句有多少都要加。这样可以防止书写失误。示例 2-2(a)为风格良好的代码行,示例 2-2(b)为风格不良的代码行。int
25、 width; / 宽度int height; / 高度int depth; / 深度int width, height, depth; / 宽度高度深度x = a + b;y = c + d;z = e + f;X a + b; y = c + d; z = e + f;if (width =”、 “”这类操作符前后不加空格。 【建议 2-3-1】对于表达式比较长的 for 语句和 if 语句,为了紧凑起见可以适当地去掉一些空格,如 for (i=0; i= 2000) / 良好的风格if(year=2000) / 不良的风格if (a=b) / 不要写成 b - Function();示例
26、 2-3 代码行内的空格4 表达式和基本语句162.4 对齐 【规则 2-4-1】程序的分界符和应独占一行并且位于同一列,同时与引用它们的语句左对齐。 【规则 2-4-2】 之内的代码块在 右边数格处左对齐。示例 2-4(a)为风格良好的对齐,示例 2-4(b)为风格不良的对齐。void Function(int x) / program codevoid Function(int x) / program codeif (condition) / program codeelse / program codeif (condition) / program codeelse / progra
27、m codefor (initialization; condition; update) / program codefor (initialization; condition; update) / program codeWhile (condition) / program codewhile (condition) / program code如果出现嵌套的 ,则使用缩进对齐,如:示例 2-4(a) 风格良好的对齐 示例 2-4(b) 风格不良的对齐4 表达式和基本语句162.5 长行拆分 【规则 2-5-1】代码行最大长度宜控制在 70 至 80 个字符以内。代码行不要过长,否则眼
28、睛看不过来,也不便于打印。 【规则 2-5-2】长表达式要在低优先级操作符处拆分成新行,操作符放在新行之首(以便突出操作符) 。拆分出的新行要进行适当的缩进,使排版整齐,语句可读。if (very_longer_variable1 = very_longer_variable12)/ 类的成员函数 【规则 3-1-8】用正确的反义词组命名具有互斥意义的变量或相反动作的函数等。例如:int minValue;int maxValue;int SetValue();int GetValue(); 【建议 3-1-1】尽量避免名字中出现数字编号,如 Value1,Value2 等,除非逻辑上的确需要
29、编号。这是为了防止程序员偷懒,不肯为命名动脑筋而导致产生无意义的名字(因为用数字编号最省事) 。3.2 简单的 Windows 应用程序命名规则作者对“匈牙利”命名规则做了合理的简化,下述的命名规则简单易用,比较适合于 Windows 应用软件的开发。 【规则 3-2-1】类名和函数名用大写字母开头的单词组合而成。4 表达式和基本语句24例如:class Node; / 类名class LeafNode; / 类名void Draw(void); / 函数名void SetValue(int value); / 函数名 【规则 3-2-2】变量和参数用小写字母开头的单词组合而成。例如:BOOL
30、 flag;int drawMode; 【规则 3-2-3】常量全用大写的字母,用下划线分割单词。例如:const int MAX = 100;const int MAX_LENGTH = 100; 【规则 3-2-4】静态变量加前缀 s_(表示 static) 。例如:void Init()static int s_initValue; / 静态变量 【规则 3-2-5】如果不得已需要全局变量,则使全局变量加前缀 g_(表示 global) 。例如:int g_howManyPeople; / 全局变量int g_howMuchMoney; / 全局变量 【规则 3-2-6】类的数据成员加前
31、缀 m_(表示 member) ,这样可以避免数据成员与成员函数的参数同名。例如:void Object:SetValue(int width, int height)m_width = width;m_height = height; 【规则 3-2-7】为了防止某一软件库中的一些标识符和其它软件库中的冲突,可以4 表达式和基本语句24为各种标识符加上能反映软件性质的前缀。例如三维图形标准 OpenGL 的所有库函数均以 gl 开头,所有常量(或宏定义)均以 GL 开头。3.3 简单的 Unix 应用程序命名规则4 表达式和基本语句254 表达式和基本语句读者可能怀疑:连 if、for、wh
32、ile、goto、switch 这样简单的东西也要探讨编程风格,是不是小题大做?我真的发觉很多程序员用隐含错误的方式写表达式和基本语句,我自己也犯过类似的错误。表达式和语句都属于 C+/C 的短语结构语法。它们看似简单,但使用时隐患比较多。本章归纳了正确使用表达式和语句的一些规则与建议。4.1 运算符的优先级C+/C 语言的运算符有数十个,运算符的优先级与结合律如表 4-1 所示。注意一元运算符 + - * 的优先级高于对应的二元运算符。优先级 运算符 结合律( ) - . 从左至右! + - (类型) sizeof+ - * return y;改写为if (condition)return
33、x;elsereturn y;或者改写成更加简练的 return (condition ? x : y);4.4 循环语句的效率C+/C 循环语句中,for 语句使用频率最高,while 语句其次,do 语句很少用。本节重点论述循环体的效率。提高循环体效率的基本办法是降低循环体的复杂性。【建议 4-4-1】在多重循环中,如果有可能,应当将最长的循环放在最内层,最短的循环放在最外层,以减少 CPU 跨切循环层的次数。例如示例 4-4(b)的效率比示例 4-4(a)的高。for (row=0; row100; row+)for ( col=0; col5; col+ )for (col=0; co
34、l5; col+ )for (row=0; row100; row+)4 表达式和基本语句29sum = sum + arowcol;sum = sum + arowcol;示例 4-4(a) 低效率:长循环在最外层 示例 4-4(b) 高效率:长循环在最内层 【建议 4-4-2】如果循环体内存在逻辑判断,并且循环次数很大,宜将逻辑判断移到循环体的外面。示例 4-4(c)的程序比示例 4-4(d)多执行了 N-1 次逻辑判断。并且由于前者老要进行逻辑判断,打断了循环“流水线”作业,使得编译器不能对循环进行优化处理,降低了效率。如果 N 非常大,最好采用示例 4-4(d)的写法,可以提高效率。如
35、果 N 非常小,两者效率差别并不明显,采用示例 4-4(c)的写法比较好,因为程序更加简洁。for (i=0; iN; i+)if (condition)DoSomething();elseDoOtherthing();if (condition)for (i=0; iN; i+)DoSomething();elsefor (i=0; iN; i+)DoOtherthing();表 4-4(c) 效率低但程序简洁 表 4-4(d) 效率高但程序不简洁4.5 for 语句的循环控制变量 【规则 4-5-1】不可在 for 循环体内修改循环变量,防止 for 循环失去控制。 【建议 4-5-1】建议 for 语句的循环控制变量的取值采用“半开半闭区间”写法。示例 4-5(a)中的 x 值属于半开半闭区间“0 = x N”,起点到终点的间隔为 N,循环次数为 N。示例 4-5(b)中的 x 值属于闭区间“0 = x = N-1”,起点到终点的间隔为 N-1,循环次数为 N。相比之下,示例 4-5(a)的写法更加直观,尽管两者的功能是相同的。for (int x=0; xN; x+)for (int x=0; x=N-1; x+)