第1章 文件结构
每一个C++/C程序通常分为两个文件。一个文件用于保存程序的声明(declaration),称为头文件。还有一个文件用于保存程序的实现(implementation),称为定义(definition)文件。
C++/C程序的头文件以“.h”为后缀,C程序的定义文件以“.c”为后缀,C++程序的定义文件通常以“.cpp”为后缀(也有一些系统以“.cc”或“.cxx”为后缀)。
1.1 版权和版本号的声明
版权和版本号的声明位于头文件和定义文件的开头(參见演示样例1-1),主要内容有:
(1)版权信息。
(2)文件名,标识符,摘要。
(3)当前版本,作者/改动者,完毕日期。
(4)版本号历史信息。
/*
* Copyright (c) 2001,上海贝尔有限公司网络应用事业部
* All rights reserved.
*
* 文件名:filename.h
* 文件标识:见配置管理计划书
* 摘 要:简要描写叙述本文件的内容
*
* 当前版本号:1.1
* 作 者:输入作者(或改动者)名字
* 完毕日期:2001年7月20日
*
* 代替版本号:1.0
* 原作者 :输入原作者(或改动者)名字
* 完毕日期:2001年5月10日
*/
|
演示样例1-1 版权和版本号的声明
1.2 头文件的结构
头文件由三部分内容组成:
(1)头文件开头处的版权和版本号声明(參见演示样例1-1)。
(2)预处理块。
(3)函数和类结构声明等。
如果头文件名为 graphics.h,头文件的结构參见演示样例1-2。
l 【规则1-2-1】为了防止头文件被反复引用,应当用ifndef/define/endif结构产生预处理块。
l 【规则1-2-2】用 #include <filename.h> 格式来引用标准库的头文件(编译器将从标准库文件夹開始搜索)。
l 【规则1-2-3】用 #include “filename.h” 格式来引用非标准库的头文件(编译器将从用户的工作文件夹開始搜索)。
² 【建议1-2-1】头文件里仅仅存放“声明”而不存放“定义”
在C++ 语法中,类的成员函数能够在声明的同一时候被定义,而且自己主动成为内联函数。这尽管会带来书写上的方便,但却造成了风格不一致,弊大于利。建议将成员函数的定义与声明分开,不论该函数体有多么小。
² 【建议1-2-2】不提倡使用全局变量,尽量不要在头文件里出现象extern int value 这类声明。
// 版权和版本号声明见演示样例1-1,此处省略。
#ifndef GRAPHICS_H // 防止graphics.h被反复引用
#define GRAPHICS_H
#include <math.h> // 引用标准库的头文件
…
#include “myheader.h” // 引用非标准库的头文件
…
void Function1(…); // 全局函数声明
…
class Box // 类结构声明
{
…
};
#endif
|
演示样例1-2 C++/C头文件的结构
1.3 定义文件的结构
定义文件有三部分内容:
(1) 定义文件开头处的版权和版本号声明(參见演示样例1-1)。
(2) 对一些头文件的引用。
(3) 程序的实现体(包含数据和代码)。
如果定义文件的名称为 graphics.cpp,定义文件的结构參见演示样例1-3。
// 版权和版本号声明见演示样例1-1,此处省略。
#include “graphics.h” // 引用头文件
…
// 全局函数的实现体
void Function1(…)
{
…
}
// 类成员函数的实现体
void Box::Draw(…)
{
…
}
|
演示样例1-3 C++/C定义文件的结构
1.4 头文件的作用
早期的编程语言如Basic、Fortran没有头文件的概念,C++/C语言的刚開始学习的人尽管会用使用头文件,但经常不明其理。这里对头文件的作用略作解释:
(1)通过头文件来调用库功能。在非常多场合,源码不便(或不准)向用户发布,仅仅要向用户提供头文件和二进制的库就可以。用户仅仅须要依照头文件里的接口声明来调用库功能,而不必关心接口怎么实现的。编译器会从库中提取对应的代码。
(2)头文件能加强类型安全检查。假设某个接口被实现或被使用时,其方式与头文件里的声明不一致,编译器就会指出错误,这一简单的规则能大大减轻程序猿调试、改错的负担。
假设一个软件的头文件数目比較多(如超过十个),通常应将头文件和定义文件分别保存于不同的文件夹,以便于维护。
比如可将头文件保存于include文件夹,将定义文件保存于source文件夹(能够是多级文件夹)。
假设某些头文件是私有的,它不会被用户的程序直接引用,则没有必要公开其“声明”。为了加强信息隐藏,这些私有的头文件能够和定义文件存放于同一个文件夹。
第2章 程序的版式
版式尽管不会影响程序的功能,但会影响可读性。程序的版式追求清晰、美观,是程序风格的重要构成因素。
能够把程序的版式比喻为“书法”。好的“书法”可让人对程序一目了然,看得兴致勃勃。差的程序“书法”如螃蟹爬行,让人看得索然无味,更令维护者烦恼有加。请程序猿们学习程序的“书法”,弥补大学计算机教育的漏洞,实在非常有必要。
空行起着分隔程序段落的作用。空行得体(只是多也只是少)将使程序的布局更加清晰。空行不会浪费内存,尽管打印含有空行的程序是会多消耗一些纸张,可是值得。所以不要舍不得用空行。
l 【规则2-1-1】在每一个类声明之后、每一个函数定义结束之后都要加空行。參见演示样例2-1(a)
l 【规则2-1-2】在一个函数体内,逻揖上密切相关的语句之间不加空行,其他地方应加空行分隔。參见演示样例2-1(b )
// 空行
void Function1(…)
{
…
}
// 空行
void Function2(…)
{
…
}
// 空行
void Function3(…)
{
…
}
|
// 空行
while (condition)
{
statement1;
// 空行
if (condition)
{
statement2;
}
else
{
statement3;
}
// 空行
statement4;
}
|
演示样例2-1(a) 函数之间的空行 演示样例2-1(b) 函数内部的空行
l 【规则2-2-1】一行代码仅仅做一件事情,如仅仅定义一个变量,或仅仅写一条语句。这种代码easy阅读,而且方便于写凝视。
l 【规则2-2-2】if、for、while、do等语句自占一行,运行语句不得紧跟其后。不论运行语句有多少都要加{}。这样能够防止书写失误。
演示样例2-2(a)为风格良好的代码行,演示样例2-2(b)为风格不良的代码行。
int width; // 宽度
int height; // 高度
int depth; // 深度
|
int width, height, depth; // 宽度高度深度
|
x = a + b;
y = c + d;
z = e + f;
|
X = a + b; y = c + d; z = e + f;
|
if (width < height)
{
dosomething();
}
|
if (width < height) dosomething();
|
for (initialization; condition; update)
{
dosomething();
}
// 空行
other();
|
for (initialization; condition; update)
dosomething();
other();
|
演示样例2-2(a) 风格良好的代码行 演示样例2-2(b) 风格不良的代码行
² 【建议2-2-1】尽可能在定义变量的同一时候初始化该变量(就近原则)
假设变量的引用处和其定义处相隔比較远,变量的初始化非常easy被忘记。假设引用了未被初始化的变量,可能会导致程序错误。本建议能够降低隐患。比如
int width = 10; // 定义并初绐化width
int height = 10; // 定义并初绐化height
int depth = 10; // 定义并初绐化depth
2.3 代码行内的空格
l 【规则2-3-1】keyword之后要留空格。象const、virtual、inline、case 等keyword之后至少要留一个空格,否则无法辨析keyword。象if、for、while等keyword之后应留一个空格再跟左括号‘(’,以突出keyword。
l 【规则2-3-2】函数名之后不要留空格,紧跟左括号‘(’,以与keyword差别。
l 【规则2-3-3】‘(’向后紧跟,‘)’、‘,’、‘;’向前紧跟,紧跟处不留空格。
l 【规则2-3-4】‘,’之后要留空格,如Function(x, y, z)。假设‘;’不是一行的结束符号,其后要留空格,如for (initialization; condition; update)。
l 【规则2-3-5】赋值操作符、比較操作符、算术操作符、逻辑操作符、位域操作符,如“=”、“+=” “>=”、“<=”、“+”、“*”、“%”、“&&”、“||”、“<<”,“^”等二元操作符的前后应当加空格。
l 【规则2-3-6】一元操作符如“!”、“~”、“++”、“--”、“&”(地址运算符)等前后不加空格。
l 【规则2-3-7】象“[]”、“.”、“->”这类操作符前后不加空格。
² 【建议2-3-1】对于表达式比較长的for语句和if语句,为了紧凑起见能够适当地去掉一些空格,如for (i=0; i<10; i++)和if ((a<=b) && (c<=d))
void Func1(int x, int y, int z); // 良好的风格
void Func1 (int x,int y,int z); // 不良的风格
|
if (year >= 2000) // 良好的风格
if(year>=2000) // 不良的风格
if ((a>=b) && (c<=d)) // 良好的风格
if(a>=b&&c<=d) // 不良的风格
|
for (i=0; i<10; i++) // 良好的风格
for(i=0;i<10;i++) // 不良的风格
for (i = 0; I < 10; i ++) // 过多的空格
|
x = a < b ? a : b; // 良好的风格
x=a<b?a:b; // 不好的风格
|
int *x = &y; // 良好的风格
int * x = & y; // 不良的风格
|
array[5] = 0; // 不要写成 array [ 5 ] = 0;
a.Function(); // 不要写成 a . Function();
b->Function(); // 不要写成 b -> Function();
|
演示样例2-3 代码行内的空格
l 【规则2-4-1】程序的分界符‘{’和‘}’应独占一行而且位于同一列,同一时候与引用它们的语句左对齐。
l 【规则2-4-2】{ }之内的代码块在‘{’右边数格处左对齐。
演示样例2-4(a)为风格良好的对齐,演示样例2-4(b)为风格不良的对齐。
void Function(int x)
{
… // program code
}
|
void Function(int x){
… // program code
}
|
if (condition)
{
… // program code
}
else
{
… // program code
}
|
if (condition){
… // program code
}
else {
… // program code
}
|
for (initialization; condition; update)
{
… // program code
}
|
for (initialization; condition; update){
… // program code
}
|
While (condition)
{
… // program code
}
|
while (condition){
… // program code
}
|
假设出现嵌套的{},则使用缩进对齐,如:
{
…
{
…
}
…
}
|
|
演示样例2-4(a) 风格良好的对齐 演示样例2-4(b) 风格不良的对齐
l 【规则2-5-1】代码行最大长度宜控制在70至80个字符以内。代码行不要过长,否则眼睛看只是来,也不便于打印。
l 【规则2-5-2】长表达式要在低优先级操作符处拆分成新行,操作符放在新行之首(以便突出操作符)。拆分出的新行要进行适当的缩进,使排版整齐,语句可读。
if ((very_longer_variable1 >= very_longer_variable12)
&& (very_longer_variable3 <= very_longer_variable14)
&& (very_longer_variable5 <= very_longer_variable16))
{
dosomething();
}
|
virtual CMatrix CMultiplyMatrix (CMatrix leftMatrix,
CMatrix rightMatrix);
|
for (very_longer_initialization;
very_longer_condition;
very_longer_update)
{
dosomething();
}
|
演示样例2-5 长行的拆分
2.6 修饰符的位置
修饰符 * 和 & 应该靠近数据类型还是该靠近变量名,是个有争议的活题。
若将修饰符 * 靠近数据类型,比如:int* x; 从语义上讲此写法比較直观,即x是int 类型的指针。
上述写法的弊端是easy引起误解,比如:int* x, y; 此处yeasy被误解为指针变量。尽管将x和y分行定义能够避免误解,但并非人人都愿意这样做。
l 【规则2-6-1】应当将修饰符 * 和 & 紧靠变量名
比如:
char *name;
int *x, y; // 此处y不会被误解为指针
C语言的凝视符为“/*…*/”。C++语言中,程序块的凝视常採用“/*…*/”,行凝视一般採用“//…”。凝视通经常使用于:
(1)版本号、版权声明;
(2)函数接口说明;
(3)重要的代码行或段落提示。
尽管凝视有助于理解代码,但注意不可过多地使用凝视。參见演示样例2-6。
l 【规则2-7-1】凝视是对代码的“提示”,而不是文档。程序中的凝视不可喧宾夺主,凝视太多了会让人眼花缭乱。凝视的花样要少。
l 【规则2-7-2】假设代码本来就是清楚的,则不必加凝视。否则多此一举,令人厌烦。比如
i++; // i 加 1,多余的凝视
l 【规则2-7-3】边写代码边凝视,改动代码同一时候改动对应的凝视,以保证凝视与代码的一致性。不再实用的凝视要删除。
l 【规则2-7-4】凝视应当准确、易懂,防止凝视有二义性。错误的凝视不但无益反而有害。
l 【规则2-7-5】尽量避免在凝视中使用缩写,特别是不经常使用缩写。
l 【规则2-7-6】凝视的位置应与被描写叙述的代码相邻,能够放在代码的上方或右方,不可放在下方。
l 【规则2-7-8】当代码比較长,特别是有多重嵌套时,应当在一些段落的结束处加凝视,便于阅读。
/*
* 函数介绍:
* 输入參数:
* 输出參数:
* 返回值 :
*/
void Function(float x, float y, float z)
{
…
}
|
if (…)
{
…
while (…)
{
…
} // end of while
…
} // end of if
|
演示样例2-6 程序的凝视
类能够将数据和函数封装在一起,当中函数表示了类的行为(或称服务)。类提供keywordpublic、protected和private,分别用于声明哪些数据和函数是公有的、受保护的或者是私有的。这样能够达到信息隐藏的目的,即让类只公开必需要让外界知道的内容,而隐藏其他一切内容。我们不能够滥用类的封装功能,不要把它当成火锅,什么东西都往里扔。
类的版式主要有两种方式:
(1)将private类型的数据写在前面,而将public类型的函数写在后面,如演示样例8-3(a)。採用这样的版式的程序猿主张类的设计“以数据为中心”,重点关注类的内部结构。
(2)将public类型的函数写在前面,而将private类型的数据写在后面,如演示样例8.3(b)採用这样的版式的程序猿主张类的设计“以行为为中心”,重点关注的是类应该提供什么样的接口(或服务)。
非常多C++教课书受到Biarne Stroustrup第一本著作的影响,不知不觉地採用了“以数据为中心”的书写方式,并不见得有多少道理。
我建议读者採用“以行为为中心”的书写方式,即首先考虑类应该提供什么样的函数。这是非常多人的经验——“这样做不仅让自己在设计类时思路清晰,并且方便别人阅读。由于用户最关心的是接口,谁愿意先看到一堆私有数据成员!”
class A
{
private:
int i, j;
float x, y;
…
public:
void Func1(void);
void Func2(void);
…
}
|
class A
{
public:
void Func1(void);
void Func2(void);
…
private:
int i, j;
float x, y;
…
}
|
演示样例8.3(a) 以数据为中心版式 演示样例8.3(b) 以行为为中心的版式
第3章 命名规则
比較著名的命名规则当推Microsoft公司的“匈牙利”法,该命名规则的主要思想是“在变量和函数名中添?前缀以增进人们对程序的理解”。比如全部的字符变量均以ch为前缀,若是指针变量则追加前缀p。假设一个变量由ppch开头,则表明它是指向字符指针的指针。
“匈牙利”法最大的缺点是烦琐,比如
int i, j, k;
float x, y, z;
倘若採用“匈牙利”命名规则,则应当写成
int iI, iJ, ik; // 前缀 i表示int类型
float fX, fY, fZ; // 前缀 f表示float类型
如此烦琐的程序会让绝大多数程序猿无法忍受。
据考察,没有一种命名规则能够让全部的程序猿赞同,程序设计教科书一般都不指定命名规则。命名规则对软件产品而言并非“成败悠关”的事,我们不要化太多精力试图发明世界上最好的命名规则,而应当制定一种令大多数项目成员惬意的命名规则,并在项目中贯彻实施。
本节论述的共性规则是被大多数程序猿採纳的,我们应当在遵循这些共性规则的前提下,再扩充特定的规则,如3.2节。
l 【规则3-1-1】标识符应当直观且能够拼读,可望文知意,不必进行“解码”。
标识符最好採用英文单词或其组合,便于记忆和阅读。切忌使用汉语拼音来命名。程序中的英文单词一般不会太复杂,用词应当准确。比如不要把CurrentValue写成NowValue。
l 【规则3-1-2】标识符的长度应当符合“min-length && max-information”原则。
几十年前老ANSI C规定名字不准超过6个字符,现今的C+ +/C不再有此限制。一般来说,长名字能更好地表达含义,所以函数名、变量名、类名长达十几个字符不足为怪。那么名字是否越长约好?不见得! 比如变量名maxval就比maxValueUntilOverflow好用。单字符的名字也是实用的,常见的如i,j,k,m,n,x,y,z等,它们通常可用作函数内的局部变量。
l 【规则3-1-3】命名规则尽量与所採用的操作系统或开发工具的风格保持一致。
比如Windows应用程序的标识符通常採用“大写和小写”混排的方式,如AddChild。而Unix应用程序的标识符通常採用“小写加下划线”的方式,如add_child。别把这两类风格混在一起用。
l 【规则3-1-4】程序中不要出现仅靠大写和小写区分的类似的标识符。
比如:
int x, X; // 变量x 与 X easy混淆
void foo(int x); // 函数foo 与FOOeasy混淆
void FOO(float x);
l 【规则3-1-5】程序中不要出现标识符全然同样的局部变量和全局变量,虽然两者的作用域不同而不会发生语法错误,但会使人误解。
l 【规则3-1-6】变量的名字应当使用“名词”或者“形容词+名词”。
比如:
float value;
float oldValue;
float newValue;
l 【规则3-1-7】全局函数的名字应当使用“动词”或者“动词+名词”(动宾词组)。类的成员函数应当仅仅使用“动词”,被省略掉的名词就是对象本身。
比如:
DrawBox(); // 全局函数
box->Draw(); // 类的成员函数
l 【规则3-1-8】用正确的反义词组命名具有相互排斥意义的变量或相反动作的函数等。
比如:
int minValue;
int maxValue;
int SetValue(…);
int GetValue(…);
² 【建议3-1-1】尽量避免名字中出现数字编号,如Value1,Value2等,除非逻辑上的确须要编号。这是为了防止程序猿偷懒,不肯为命名动脑筋而导致产生无意义的名字(由于用数字编号最省事)。
3.2 简单的Windows应用程序命名规则
作者对“匈牙利”命名规则做了合理的简化,下述的命名规则简单易用,比較适合于Windows应用软件的开发。
l 【规则3-2-1】类名和函数名用大写字母开头的单词组合而成。
比如:
class Node; // 类名
class LeafNode; // 类名
void Draw(void); // 函数名
void SetValue(int value); // 函数名
l 【规则3-2-2】变量和參数用小写字母开头的单词组合而成。
比如:
BOOL flag;
int drawMode;
l 【规则3-2-3】常量全用大写的字母,用下划线切割单词。
比如:
const int MAX = 100;
const int MAX_LENGTH = 100;
l 【规则3-2-4】静态变量加前缀s_(表示static)。
比如:
void Init(…)
{
static int s_initValue; // 静态变量
…
}
l 【规则3-2-5】假设不得已须要全局变量,则使全局变量加前缀g_(表示global)。
比如:
int g_howManyPeople; // 全局变量
int g_howMuchMoney; // 全局变量
l 【规则3-2-6】类的数据成员加前缀m_(表示member),这样能够避免数据成员与成员函数的參数同名。
比如:
void Object::SetValue(int width, int height)
{
m_width = width;
m_height = height;
}
l 【规则3-2-7】为了防止某一软件库中的一些标识符和其他软件库中的冲突,能够为各种标识符加上能反映软件性质的前缀。比如三维图形标准OpenGL的全部库函数均以gl开头,全部常量(或宏定义)均以GL开头。
3.3 简单的Unix应用程序命名规则
第4章 表达式和基本语句
读者可能怀疑:连if、for、while、goto、switch这样简单的东西也要探讨编程风格,是不是小题大做?
我真的发觉非常多程序猿用隐含错误的方式写表达式和基本语句,我自己也犯过相似的错误。
表达式和语句都属于C++/C的短语结构语法。它们看似简单,但使用时隐患比較多。本章归纳了正确使用表达式和语句的一些规则与建议。
4.1 运算符的优先级
C++/C语言的运算符有数十个,运算符的优先级与结合律如表4-1所看到的。注意一元运算符 + - * 的优先级高于相应的二元运算符。
优先级
|
运算符
|
结合律
|
从
高
到
低
排
列
|
( ) [ ] -> .
|
从左至右
|
! ~ ++ -- (类型) sizeof
+ - * &
|
从右至左
|
* / %
|
从左至右
|
+ -
|
从左至右
|
<< >>
|
从左至右
|
< <= > >=
|
从左至右
|
== !=
|
从左至右
|
&
|
从左至右
|
^
|
从左至右
|
|
|
从左至右
|
&&
|
从左至右
|
||
|
从右至左
|
?:
|
从右至左
|
= += -= *= /= %= &= ^=
|= <<= >>=
|
从左至右
|
表4-1 运算符的优先级与结合律
l 【规则4-1-1】假设代码行中的运算符比較多,用括号确定表达式的操作顺序,避免使用默认的优先级。
因为将表4-1熟记是比較困难的,为了防止产生歧义并提高可读性,应当用括号确定表达式的操作顺序。比如:
word = (high << 8) | low
if ((a | b) && (a & c))
如 a = b = c = 0这种表达式称为复合表达式。同意复合表达式存在的理由是:(1)书写简洁;(2)能够提高编译效率。但要防止滥用复合表达式。
l 【规则4-2-1】不要编写太复杂的复合表达式。
比如:
i = a >= b && c < d && c + f <= g + h ; // 复合表达式过于复杂
l 【规则4-2-2】不要有多用途的复合表达式。
比如:
d = (a = b + c) + r ;
该表达式既求a值又求d值。应该拆分为两个独立的语句:
a = b + c;
d = a + r;
l 【规则4-2-3】不要把程序中的复合表达式与“真正的数学表达式”混淆。
比如:
if (a < b < c) // a < b < c是数学表达式而不是程序表达式
并不表示
if ((a<b) && (b<c))
而是成了令人费解的
if ( (a<b)<c )
if语句是C++/C语言中最简单、最经常使用的语句,然而非常多程序猿用隐含错误的方式写if语句。本节以“与零值比較”为例,展开讨论。
4.3.1 布尔变量与零值比較
l 【规则4-3-1】不可将布尔变量直接与TRUE、FALSE或者1、0进行比較。
依据布尔类型的语义,零值为“假”(记为FALSE),不论什么非零值都是“真”(记为TRUE)。TRUE的值到底是什么并没有统一的标准。比如Visual C++ 将TRUE定义为1,而Visual Basic则将TRUE定义为-1。
如果布尔变量名字为flag,它与零值比較的标准if语句例如以下:
if (flag) // 表示flag为真
if (!flag) // 表示flag为假
其他的使用方法都属于不良风格,比如:
if (flag == TRUE)
if (flag == 1 )
if (flag == FALSE)
if (flag == 0)
4.3.2 整型变量与零值比較
l 【规则4-3-2】应当将整型变量用“==”或“!=”直接与0比較。
如果整型变量的名字为value,它与零值比較的标准if语句例如以下:
if (value == 0)
if (value != 0)
不可模仿布尔变量的风格而写成
if (value) // 会让人误解 value是布尔变量
if (!value)
4.3.3 浮点变量与零值比較
l 【规则4-3-3】不可将浮点变量用“==”或“!=”与不论什么数字比較。
千万要留意,不管是float还是double类型的变量,都有精度限制。所以一定要避免将浮点变量用“==”或“!=”与数字比較,应该设法转化成“>=”或“<=”形式。
如果浮点变量的名字为x,应当将
if (x == 0.0) // 隐含错误的比較
转化为
if ((x>=-EPSINON) && (x<=EPSINON))
当中EPSINON是同意的误差(即精度)。
4.3.4 指针变量与零值比較
l 【规则4-3-4】应当将指针变量用“==”或“!=”与NULL比較。
指针变量的零值是“空”(记为NULL)。虽然NULL的值与0同样,可是两者意义不同。如果指针变量的名字为p,它与零值比較的标准if语句例如以下:
if (p == NULL) // p与NULL显式比較,强调p是指针变量
if (p != NULL)
不要写成
if (p == 0) // easy让人误解p是整型变量
if (p != 0)
或者
if (p) // easy让人误解p是布尔变量
if (!p)
4.3.5 对if语句的补充说明
有时候我们可能会看到 if (NULL == p) 这样古怪的格式。不是程序写错了,是程序猿为了防止将 if (p == NULL) 误写成 if (p = NULL),而有意把p和NULL颠倒。编译器觉得 if (p = NULL) 是合法的,可是会指出 if (NULL = p)是错误的,由于NULL不能被赋值。
程序中有时会遇到if/else/return的组合,应该将例如以下不良风格的程序
if (condition)
return x;
return y;
改写为
if (condition)
{
return x;
}
else
{
return y;
}
或者改写成更加简练的
return (condition ? x : y);
4.4 循环语句的效率
C++/C循环语句中,for语句使用频率最高,while语句其次,do语句非常少用。本节重点论述循环体的效率。提高循环体效率的基本办法是减少循环体的复杂性。
l 【建议4-4-1】在多重循环中,假设有可能,应当将最长的循环放在最内层,最短的循环放在最外层,以降低CPU跨切循环层的次数。比如演示样例4-4(b)的效率比演示样例4-4(a)的高。
for (row=0; row<100; row++)
{
for ( col=0; col<5; col++ )
{
sum = sum + a[row][col];
}
}
|
for (col=0; col<5; col++ )
{
for (row=0; row<100; row++)
{
sum = sum + a[row][col];
}
}
|
演示样例4-4(a) 低效率:长循环在最外层 演示样例4-4(b) 高效率:长循环在最内层
l 【建议4-4-2】假设循环体内存在逻辑推断,而且循环次数很大,宜将逻辑推断移到循环体的外面。演示样例4- 4(c)的程序比演示样例4-4(d)多运行了N-1次逻辑推断。而且由于前者老要进行逻辑推断,打断了循环“流水线”作业,使得编译器不能对循环进行优化处理,减少了效率。假设N很大,最好採用演示样例4-4(d)的写法,能够提高效率。假设N很小,两者效率区别并不明显,採用演示样例4-4(c)的写法比較好,由于程序更加简洁。
for (i=0; i<N; i++)
{
if (condition)
DoSomething();
else
DoOtherthing();
}
|
if (condition)
{
for (i=0; i<N; i++)
DoSomething();
}
else
{
for (i=0; i<N; i++)
DoOtherthing();
}
|
表4-4(c) 效率低但程序简洁 表4-4(d) 效率高但程序不简洁
l 【规则4-5-1】不可在for 循环体内改动循环变量,防止for 循环失去控制。
l 【建议4-5-1】建议for语句的循环控制变量的取值採用“半开半闭区间”写法。
演示样例4-5(a)中的x值属于半开半闭区间“0 =< x < N”,起点到终点的间隔为N,循环次数为N。
演示样例4-5(b)中的x值属于闭区间“0 =< x <= N-1”,起点到终点的间隔为N-1,循环次数为N。
相比之下,演示样例4-5(a)的写法更加直观,虽然两者的功能是同样的。
for (int x=0; x<N; x++)
{
…
}
|
for (int x=0; x<=N-1; x++)
{
…
}
|
演示样例4-5(a) 循环变量属于半开半闭区间 演示样例4-5(b) 循环变量属于闭区间
有了if语句为什么还要switch语句?
switch是多分支选择语句,而if语句仅仅有两个分支可供选择。尽管能够用嵌套的if语句来实现多分支选择,但那样的程序冗长难读。这是switch语句存在的理由。
switch语句的基本格式是:
switch (variable)
{
case value1 : …
break;
case value2 : …
break;
…
default : …
break;
}
l 【规则4-6-1】每一个case语句的结尾不要忘了加break,否则将导致多个分支重叠(除非有意使多个分支重叠)。
l 【规则4-6-2】不要忘记最后那个default分支。即使程序真的不须要default处理,也应该保留语句 default : break; 这样做并不是多此一举,而是为了防止别人误以为你忘了default处理。
自从提倡结构化设计以来,goto就成了有争议的语句。首先,因为goto语句能够灵活跳转,假设不加限制,它的确会破坏结构化设计风格。其次,goto语句常常带来错误或隐患。它可能跳过了某些对象的构造、变量的初始化、重要的计算等语句,比如:
goto state;
String s1, s2; // 被goto跳过
int sum = 0; // 被goto跳过
…
state:
…
假设编译器不能发觉此类错误,每用一次goto语句都可能留下隐患。
非常多人建议废除C++/C的goto语句,以绝后患。但实事求是地说,错误是程序猿自己造成的,不是goto的过错。goto 语句至少有一处可显神通,它能从多重循环体中咻地一下子跳到外面,用不着写非常多次的break语句; 比如
{ …
{ …
{ …
goto error;
}
}
}
error:
…
就象楼房着火了,来不及从楼梯一级一级往下走,可从窗体跳出火坑。所以我们主张少用、慎用goto语句,而不是禁用。
常量是一种标识符,它的值在执行期间恒定不变。C语言用 #define来定义常量(称为宏常量)。C++ 语言除了 #define外还能够用const来定义常量(称为const常量)。
5.1 为什么须要常量
假设不使用常量,直接在程序中填写数字或字符串,将会有什么麻烦?
(1) 程序的可读性(可理解性)变差。程序猿自己会忘记那些数字或字符串是什么意思,用户则更加不知它们从何处来、表示什么。
(2) 在程序的非常多地方输入相同的数字或字符串,难保不发生书写错误。
(3) 假设要修改数字或字符串,则会在非常多地方修改,既麻烦又easy出错。
l 【规则5-1-1】 尽量使用含义直观的常量来表示那些将在程序中多次出现的数字或字符串。
比如:
#define MAX 100 /* C语言的宏常量 */
const int MAX = 100; // C++ 语言的const常量
const float PI = 3.14159; // C++ 语言的const常量
C++ 语言能够用const来定义常量,也能够用 #define来定义常量。可是前者比后者有很多其它的长处:
(1) const常量有数据类型,而宏常量没有数据类型。编译器能够对前者进行类型安全检查。而对后者仅仅进行字符替换,没有类型安全检查,而且在字符替换可能会产生意料不到的错误(边际效应)。
(2) 有些集成化的调试工具能够对const常量进行调试,可是不能对宏常量进行调试。
l 【规则5-2-1】在C++ 程序中仅仅使用const常量而不使用宏常量,即const常量全然代替宏常量。
5.3 常量定义规则
l 【规则5-3-1】须要对外公开的常量放在头文件里,不须要对外公开的常量放在定义文件的头部。为便于管理,能够把不同模块的常量集中存放在一个公共的头文件里。
l 【规则5-3-2】假设某一常量与其他常量密切相关,应在定义中包括这样的关系,而不应给出一些孤立的值。
比如:
const float RADIUS = 100;
const float DIAMETER = RADIUS * 2;
有时我们希望某些常量仅仅在类中有效。由于#define 定义的宏常量是全局的,不能达到目的,于是想当然地认为应该用const修饰数据成员来实现。const数据成员的确是存在的,但其含义却不是我们所期望的。const数据成员仅仅在某个对象生存期内是常量,而对于整个类而言却是可变的,由于类能够创建多个对象,不同的对象其const数据成员的值能够不同。
不能在类声明中初始化const数据成员。下面使用方法是错误的,由于类的对象未被创建时,编译器不知道SIZE的值是什么。
class A
{…
const int SIZE = 100; // 错误,企图在类声明中初始化const数据成员
int array[SIZE]; // 错误,未知的SIZE
};
const数据成员的初始化仅仅能在类构造函数的初始化表中进行,比如
class A
{…
A(int size); // 构造函数
const int SIZE ;
};
A::A(int size) : SIZE(size) // 构造函数的初始化表
{
…
}
A a(100); // 对象 a 的SIZE值为100
A b(200); // 对象 b 的SIZE值为200
如何才干建立在整个类中都恒定的常量呢?别指望const数据成员了,应该用类中的枚举常量来实现。比如
class A
{…
enum { SIZE1 = 100, SIZE2 = 200}; // 枚举常量
int array1[SIZE1];
int array2[SIZE2];
};
枚举常量不会占用对象的存储空间,它们在编译时被所有求值。枚举常量的缺点是:它的隐含数据类型是整数,其最大值有限,且不能表示浮点数(如PI=3.14159)。
第6章 函数设计
函数是C++/C程序的基本功能单元,其重要性不言而喻。函数设计的细微缺点非常easy导致该函数被错用,所以光使函数的功能正确是不够的。本章重点论述函数的接口设计和内部实现的一些规则。
函数接口的两个要素是參数和返回值。C语言中,函数的參数和返回值的传递方式有两种:值传递(pass by value)和指针传递(pass by pointer)。C++ 语言中多了引用传递(pass by reference)。因为引用传递的性质象指针传递,而使用方式却象值传递,刚開始学习的人经常迷惑不解,easy引起混乱,请先阅读6.6节“引用与指针的比較”。
l 【规则6-1-1】參数的书写要完整,不要贪图省事仅仅写參数的类型而省略參数名字。假设函数没有參数,则用void填充。
比如:
void SetValue(int width, int height); // 良好的风格
void SetValue(int, int); // 不良的风格
float GetValue(void); // 良好的风格
float GetValue(); // 不良的风格
l 【规则6-1-2】參数命名要恰当,顺序要合理。
比如编写字符串拷贝函数StringCopy,它有两个參数。假设把參数名字起为str1和str2,比如
void StringCopy(char *str1, char *str2);
那么我们非常难搞清楚到底是把str1复制到str2中,还是刚好倒过来。
能够把參数名字起得更有意义,如叫strSource和strDestination。这样从名字上就能够看出应该把strSource复制到strDestination。
另一个问题,这两个參数那一个该在前那一个该在后?參数的顺序要遵循程序猿的习惯。一般地,应将目的參数放在前面,源參数放在后面。
假设将函数声明为:
void StringCopy(char *strSource, char *strDestination);
别人在使用时可能会不假思索地写成例如以下形式:
char str[20];
StringCopy(str, “Hello World”); // 參数顺序颠倒
l 【规则6-1-3】假设參数是指针,且仅作输入用,则应在类型前加const,以防止该指针在函数体内被意外改动。
比如:
void StringCopy(char *strDestination,const char *strSource);
l 【规则6-1-4】假设输入參数以值传递的方式传递对象,则宜改用“const &”方式来传递,这样能够省去暂时对象的构造和析构过程,从而提高效率。
² 【建议6-1-1】避免函数有太多的參数,參数个数尽量控制在5个以内。假设參数太多,在使用时easy将參数类型或顺序搞错。
² 【建议6-1-2】尽量不要使用类型和数目不确定的參数。
C标准库函数printf是採用不确定參数的典型代表,其原型为:
int printf(const chat *format[, argument]…);
这样的风格的函数在编译时丧失了严格的类型安全检查。
6.2 返回值的规则
l 【规则6-2-1】不要省略返回值的类型。
C语言中,凡不加类型说明的函数,一律自己主动按整型处理。这样做不会有什么优点,却easy被误解为void类型。
C++语言有非常严格的类型安全检查,不同意上述情况发生。因为C++程序能够调用C函数,为了避免混乱,规定不论什么C++/ C函数都必须有类型。假设函数没有返回值,那么应声明为void类型。
l 【规则6-2-2】函数名字与返回值类型在语义上不可冲突。
违反这条规则的典型代表是C标准库函数getchar。
比如:
char c;
c = getchar();
if (c == EOF)
…
依照getchar名字的意思,将变量c声明为char类型是非常自然的事情。但不幸的是getchar的确不是char类型,而是int类型,其原型例如以下:
int getchar(void);
因为c是char类型,取值范围是[-128,127],假设宏EOF的值在char的取值范围之外,那么if语句将总是失败,这样的“危急”人们一般哪里料得到!导致本例错误的责任并不在用户,是函数getchar误导了使用者。
l 【规则6-2-3】不要将正常值和错误标志混在一起返回。正常值用输出參数获得,而错误标志用return语句返回。
回想上例,C标准库函数的设计者为什么要将getchar声明为令人迷糊的int类型呢?他会那么傻吗?
在正常情况下,getchar的确返回单个字符。但假设getchar碰到文件结束标志或发生读错误,它必须返回一个标志EOF。为了差别于正常的字符,仅仅好将EOF定义为负数(通常为负1)。因此函数getchar就成了int类型。
我们在实际工作中,常常会碰到上述令人为难的问题。为了避免出现误解,我们应该将正常值和错误标志分开。即:正常值用输出參数获得,而错误标志用return语句返回。
函数getchar能够改写成 BOOL GetChar(char *c);
尽管gechar比GetChar灵活,比如 putchar(getchar()); 可是假设getchar用错了,它的灵活性又有什么用呢?
² 【建议6-2-1】有时候函数原本不须要返回值,但为了添加?灵活性如支持链式表达,能够附加返回值。
比如字符串拷贝函数strcpy的原型:
char *strcpy(char *strDest,const char *strSrc);
strcpy函数将strSrc拷贝至输出參数strDest中,同一时候函数的返回值又是strDest。这样做并不是多此一举,能够获得例如以下灵活性:
char str[20];
int length = strlen( strcpy(str, “Hello World”) );
² 【建议6-2-2】假设函数的返回值是一个对象,有些场合用“引用传递”替换“值传递”能够提高效率。而有些场合仅仅能用“值传递”而不能用“引用传递”,否则会出错。
比如:
class String
{…
// 赋值函数
String & operate=(const String &other);
// 相加函数,假设没有friend修饰则仅仅许有一个右側參数
friend String operate+( const String &s1, const String &s2);
private:
char *m_data;
}
String的赋值函数operate = 的实现例如以下:
String & String::operate=(const String &other)
{
if (this == &other)
return *this;
delete m_data;
m_data = new char[strlen(other.data)+1];
strcpy(m_data, other.data);
return *this; // 返回的是 *this的引用,无需拷贝过程
}
对于赋值函数,应当用“引用传递”的方式返回String对象。假设用“值传递”的方式,尽管功能仍然正确,但因为return语句要把 *this复制到保存返回值的外部存储单元之中,添加?了不必要的开销,减少了赋值函数的效率。比如:
String a,b,c;
…
a = b; // 假设用“值传递”,将产生一次 *this 拷贝
a = b = c; // 假设用“值传递”,将产生两次 *this 拷贝
String的相加函数operate + 的实现例如以下:
String operate+(const String &s1, const String &s2)
{
String temp;
delete temp.data; // temp.data是仅含‘/0’的字符串
temp.data = new char[strlen(s1.data) + strlen(s2.data) +1];
strcpy(temp.data, s1.data);
strcat(temp.data, s2.data);
return temp;
}
对于相加函数,应当用“值传递”的方式返回String对象。假设改用“引用传递”,那么函数返回值是一个指向局部对象temp的“引用”。因为temp在函数结束时被自己主动销毁,将导致返回的“引用”无效。比如:
c = a + b;
此时 a + b 并不返回期望值,c什么也得不到,流下了隐患。
6.3 函数内部实现的规则
不同功能的函数其内部实现各不同样,看起来似乎无法就“内部实现”达成一致的观点。但依据经验,我们能够在函数体的“入口处”和“出口处”从严把关,从而提高函数的质量。
l 【规则6-3-1】在函数体的“入口处”,对參数的有效性进行检查。
非常多程序错误是由非法參数引起的,我们应该充分理解并正确使用“断言”(assert)来防止此类错误。详见6.5节“使用断言”。
l 【规则6-3-2】在函数体的“出口处”,对return语句的正确性和效率进行检查。
假设函数有返回值,那么函数的“出口处”是return语句。我们不要藐视return语句。假设return语句写得不好,函数要么出错,要么效率低下。
注意事项例如以下:
(1)return语句不可返回指向“栈内存”的“指针”或者“引用”,由于该内存在函数体结束时被自己主动销毁。比如
char * Func(void)
{
char str[] = “hello world”; // str的内存位于栈上
…
return str; // 将导致错误
}
(2)要搞清楚返回的到底是“值”、“指针”还是“引用”。
(3)假设函数返回值是一个对象,要考虑return语句的效率。比如
return String(s1 + s2);
这是暂时对象的语法,表示“创建一个暂时对象并返回它”。不要以为它与“先创建一个局部对象temp并返回它的结果”是等价的,如
String temp(s1 + s2);
return temp;
实质不然,上述代码将发生三件事。首先,temp对象被创建,同一时候完毕初始化;然后拷贝构造函数把temp复制到保存返回值的外部存储单元中;最后,temp在函数结束时被销毁(调用析构函数)。然而“创建一个暂时对象并返回它”的过程是不同的,编译器直接把暂时对象创建并初始化在外部存储单元中,省去了拷贝和析构的化费,提高了效率。
相似地,我们不要将
return int(x + y); // 创建一个暂时变量并返回它
写成
int temp = x + y;
return temp;
因为内部数据类型如int,float,double的变量不存在构造函数与析构函数,尽管该“暂时变量的语法”不会提高多少效率,可是程序更加简洁易读。
² 【建议6-4-1】函数的功能要单一,不要设计多用途的函数。
² 【建议6-4-2】函数体的规模要小,尽量控制在50行代码之内。
² 【建议6-4-3】尽量避免函数带有“记忆”功能。同样的输入应当产生同样的输出。
带有“记忆”功能的函数,其行为可能是不可预測的,由于它的行为可能取决于某种“记忆状态”。这种函数既不易理解又不利于測试和维护。在C/C++语言中,函数的static局部变量是函数的“记忆”存储器。建议尽量少用static局部变量,除非必需。
² 【建议6-4-4】不仅要检查输入參数的有效性,还要检查通过其他途径进入函数体内的变量的有效性,比如全局变量、文件句柄等。
² 【建议6-4-5】用于出错处理的返回值一定要清楚,让使用者不easy忽视或误解错误情况。
程序一般分为Debug版本号和Release版本号,Debug版本号用于内部调试,Release版本号发行给用户使用。
断言assert是仅在Debug版本号起作用的宏,它用于检查“不应该”发生的情况。演示样例6-5是一个内存复制函数。在执行过程中,假设assert的參数为假,那么程序就会中止(一般地还会出现提示对话,说明在什么地方引发了assert)。
void *memcpy(void *pvTo, const void *pvFrom, size_t size)
{
assert((pvTo != NULL) && (pvFrom != NULL)); // 使用断言
byte *pbTo = (byte *) pvTo; // 防止改变pvTo的地址
byte *pbFrom = (byte *) pvFrom; // 防止改变pvFrom的地址
while(size -- > 0 )
*pbTo ++ = *pbFrom ++ ;
return pvTo;
}
|
演示样例6-5 复制不重叠的内存块
assert不是一个仓促拼凑起来的宏。为了不在程序的Debug版本号和Release版本号引起区别,assert不应该产生不论什么副作用。所以assert不是函数,而是宏。程序猿能够把assert看成一个在不论什么系统状态下都能够安全使用的无害測试手段。假设程序在assert处终止了,并非说含有该assert的函数有错误,而是调用者出了差错,assert能够帮助我们找到错误发生的原因。
非常少有比跟踪到程序的断言,却不知道该断言的作用更让人沮丧的事了。你化了非常多时间,不是为了排除错误,而仅仅是为了弄清楚这个错误究竟是什么。有的时候,程序猿偶尔还会设计出有错误的断言。所以假设搞不清楚断言检查的是什么,就非常难推断错误是出如今程序中,还是出如今断言中。幸运的是这个问题非常好解决,仅仅要加上清楚的凝视就可以。这本是显而易见的事情,但是非常少有程序猿这样做。这好比一个人在森林里,看到树上钉着一块“危急”的大牌子。但危急究竟是什么?树要倒?有废井?有野兽?除非告诉人们“危急”是什么,否则这个警告牌难以起到积极有效的作用。难以理解的断言经常被程序猿忽略,甚至被删除。[Maguire, p8-p30]
l 【规则6-5-1】使用断言捕捉不应该发生的非法情况。不要混淆非法情况与错误情况之间的差别,后者是必定存在的而且是一定要作出处理的。
l 【规则6-5-2】在函数的入口处,使用断言检查參数的有效性(合法性)。
l 【建议6-5-1】在编写函数时,要进行重复的考查,而且自问:“我打算做哪些假定?”一旦确定了的假定,就要使用断言对假定进行检查。
l 【建议6-5-2】一般教科书都鼓舞程序猿们进行防错设计,但要记住这样的编程风格可能会隐瞒错误。当进行防错设计时,假设“不可能发生”的事情的确发生了,则要使用断言进行报警。
6.6 引用与指针的比較
引用是C++中的概念,刚開始学习的人easy把引用和指针混淆一起。一下程序中,n是m的一个引用(reference),m是被引用物(referent)。
int m;
int &n = m;
n相当于m的别名(外号),对n的不论什么操作就是对m的操作。比如有人名叫王小毛,他的外号是“三毛”。说“三毛”怎么怎么的,事实上就是对王小毛说三道四。所以n既不是m的拷贝,也不是指向m的指针,事实上n就是m它自己。
引用的一些规则例如以下:
(1)引用被创建的同一时候必须被初始化(指针则能够在不论什么时候被初始化)。
(2)不能有NULL引用,引用必须与合法的存储单元关联(指针则能够是NULL)。
(3)一旦引用被初始化,就不能改变引用的关系(指针则能够随时改变所指的对象)。
下面演示样例程序中,k被初始化为i的引用。语句k = j并不能将k改动成为j的引用,仅仅是把k的值改变成为6。因为k是i的引用,所以i的值也变成了6。
int i = 5;
int j = 6;
int &k = i;
k = j; // k和i的值都变成了6;
上面的程序看起来象在玩文字游戏,没有体现出引用的价值。引用的主要功能是传递函数的參数和返回值。C++语言中,函数的參数和返回值的传递方式有三种:值传递、指针传递和引用传递。
下面是“值传递”的演示样例程序。因为Func1函数体内的x是外部变量n的一份拷贝,改变x的值不会影响n, 所以n的值仍然是0。
void Func1(int x)
{
x = x + 10;
}
…
int n = 0;
Func1(n);
cout << “n = ” << n << endl; // n = 0
下面是“指针传递”的演示样例程序。因为Func2函数体内的x是指向外部变量n的指针,改变该指针的内容将导致n的值改变,所以n的值成为10。
void Func2(int *x)
{
(* x) = (* x) + 10;
}
…
int n = 0;
Func2(&n);
cout << “n = ” << n << endl; // n = 10
下面是“引用传递”的演示样例程序。因为Func3函数体内的x是外部变量n的引用,x和n是同一个东西,改变x等于改变n,所以n的值成为10。
void Func3(int &x)
{
x = x + 10;
}
…
int n = 0;
Func3(n);
cout << “n = ” << n << endl; // n = 10
对照上述三个演示样例程序,会发现“引用传递”的性质象“指针传递”,而书写方式象“值传递”。实际上“引用”可以做的不论什么事情“指针”也都可以做,为什么还要“引用”这东西?
答案是“用适当的工具做恰如其分的工作”。
指针可以毫无约束地操作内存中的怎样东西,虽然指针功能强大,可是很危急。就象一把刀,它可以用来砍树、裁纸、修指甲、理发等等,谁敢这样用?
假设的确仅仅须要借用一下某个对象的“别名”,那么就用“引用”,而不要用“指针”,以免发生意外。比方说,某人须要一份证明,本来在文件上盖上公章的印子即可了,假设把取公章的钥匙交给他,那么他就获得了不该有的权利。
第7章 内存管理
欢迎进入内存这片雷区。伟大的Bill Gates 以前失言:
640K ought to be enough for everybody
— Bill Gates 1981
程序猿们常常编写内存管理程序,往往提心吊胆。假设不想触雷,唯一的解决的方法就是发现全部潜伏的地雷而且排除它们,躲是躲不了的。本章的内容比一般教科书的要深入得多,读者需细心阅读,做到真正地通晓内存管理。
内存分配方式有三种:
(1) 从静态存储区域分配。内存在程序编译的时候就已经分配好,这块内存在程序的整个执行期间都存在。比如全局变量,static变量。
(2) 在栈上创建。在运行函数时,函数内局部变量的存储单元都能够在栈上创建,函数运行结束时这些存储单元自己主动被释放。栈内存分配运算内置于处理器的指令集中,效率非常高,可是分配的内存容量有限。
(3) 从堆上分配,亦称动态内存分配。程序在执行的时候用malloc或new申请随意多少的内存,程序猿自己负责在何时用free或delete释放内存。动态内存的生存期由我们决定,使用很灵活,但问题也最多。
7.2常见的内存错误及其对策
发生内存错误是件很麻烦的事情。编译器不能自己主动发现这些错误,一般是在程序执行时才干捕捉到。而这些错误大多没有明显的症状,时隐时现,添加?了改错的难度。有时用户怒气冲冲地把你找来,程序却没有发生不论什么问题,你一走,错误又发作了。
常见的内存错误及其对策例如以下:
u 内存分配未成功,却使用了它。
编程新手常犯这样的错误,由于他们没有意识到内存分配会不成功。经常使用解决的方法是,在使用内存之前检查指针是否为NULL。假设指针p是函数的參数,那么在函数的入口处用assert(p!=NULL)进行检查。假设是用malloc或new来申请内存,应该用if(p==NULL) 或if(p!=NULL)进行防错处理。
u 内存分配尽管成功,可是尚未初始化就引用它。
犯这样的错误主要有两个起因:一是没有初始化的观念;二是误以为内存的缺省初值全为零,导致引用初值错误(比如数组)。
内存的缺省初值到底是什么并没有统一的标准,虽然有些时候为零值,我们宁可信其无不可信其有。所以不管用何种方式创建数组,都别忘了赋初值,即便是赋零值也不可省略,不要嫌麻烦。
u 内存分配成功而且已经初始化,但操作越过了内存的边界。
比如在使用数组时常常发生下标“多1”或者“少1”的操作。特别是在for循环语句中,循环次数非常easy搞错,导致数组操作越界。
u 忘记了释放内存,造成内存泄露。
含有这样的错误的函数每被调用一次就丢失一块内存。刚開始时系统的内存充足,你看不到错误。终有一次程序突然死掉,系统出现提示:内存耗尽。
动态内存的申请与释放必须配对,程序中malloc与free的使用次数一定要同样,否则肯定有错误(new/delete同理)。
u 释放了内存却继续使用它。
有三种情况:
(1)程序中的对象调用关系过于复杂,实在难以搞清楚某个对象到底是否已经释放了内存,此时应该又一次设计数据结构,从根本上解决对象管理的混乱局面。
(2)函数的return语句写错了,注意不要返回指向“栈内存”的“指针”或者“引用”,由于该内存在函数体结束时被自己主动销毁。
(3)使用free或delete释放了内存后,没有将指针设置为NULL。导致产生“野指针”。
l 【规则7-2-1】用malloc或new申请内存之后,应该马上检查指针值是否为NULL。防止使用指针值为NULL的内存。
l 【规则7-2-2】不要忘记为数组和动态内存赋初值。防止将未被初始化的内存作为右值使用。
l 【规则7-2-3】避免数组或指针的下标越界,特别要当心发生“多1”或者“少1”操作。
l 【规则7-2-4】动态内存的申请与释放必须配对,防止内存泄漏。
l 【规则7-2-5】用free或delete释放了内存之后,马上将指针设置为NULL,防止产生“野指针”。
7.3指针与数组的对照
C++/C程序中,指针和数组在不少地方能够相互替换着用,让人产生一种错觉,以为两者是等价的。
数组要么在静态存储区被创建(如全局数组),要么在栈上被创建。数组名相应着(而不是指向)一块内存,其地址与容量在生命期内保持不变,仅仅有数组的内容能够改变。
指针能够随时指向随意类型的内存块,它的特征是“可变”,所以我们经常使用指针来操作动态内存。指针远比数组灵活,但也更危急。
以下以字符串为例比較指针与数组的特性。
7.3.1 改动内容
演示样例7-3-1中,字符数组a的容量是6个字符,其内容为hello/0。a的内容能够改变,如a[0]= ‘X’。指针p指向常量字符串“world”(位于静态存储区,内容为world/0),常量字符串的内容是不能够被改动的。从语法上看,编译器并不认为语句p[0]= ‘X’有什么不妥,可是该语句企图改动常量字符串的内容而导致执行错误。
char a[] = “hello”;
a[0] = ‘X’;
cout << a << endl;
char *p = “world”; // 注意p指向常量字符串
p[0] = ‘X’; // 编译器不能发现该错误
cout << p << endl;
|
演示样例7-3-1 改动数组和指针的内容
7.3.2 内容复制与比較
不能对数组名进行直接复制与比較。演示样例7-3-2中,若想把数组a的内容复制给数组b,不能用语句 b = a ,否则将产生编译错误。应该用标准库函数strcpy进行复制。同理,比較b和a的内容是否同样,不能用if(b==a) 来推断,应该用标准库函数strcmp进行比較。
语句p = a 并不能把a的内容复制指针p,而是把a的地址赋给了p。要想复制a的内容,能够先用库函数malloc为p申请一块容量为strlen(a)+1个字符的内存,再用strcpy进行字符串复制。同理,语句if(p==a) 比較的不是内容而是地址,应该用库函数strcmp来比較。
// 数组…
char a[] = "hello";
char b[10];
strcpy(b, a); // 不能用 b = a;
if(strcmp(b, a) == 0) // 不能用 if (b == a)
…
|
// 指针…
int len = strlen(a);
char *p = (char *)malloc(sizeof(char)*(len+1));
strcpy(p,a); // 不要用 p = a;
if(strcmp(p, a) == 0) // 不要用 if (p == a)
…
|
演示样例7-3-2 数组和指针的内容复制与比較
7.3.3 计算内存容量
用运算符sizeof能够计算出数组的容量(字节数)。演示样例7-3-3(a)中,sizeof(a)的值是12(注意别忘了’/0’)。指针p指向a,可是sizeof(p)的值却是4。这是由于sizeof(p)得到的是一个指针变量的字节数,相当于sizeof(char*),而不是p所指的内存容量。C++/C语言没有办法知道指针所指的内存容量,除非在申请内存时记住它。
注意当数组作为函数的參数进行传递时,该数组自己主动退化为同类型的指针。演示样例7-3-3(b)中,不论数组a的容量是多少,sizeof(a)始终等于sizeof(char *)。
char a[] = "hello world";
char *p = a;
cout<< sizeof(a) << endl; // 12字节
cout<< sizeof(p) << endl; // 4字节
|
演示样例7-3-3(a) 计算数组和指针的内存容量
void Func(char a[100])
{
cout<< sizeof(a) << endl; // 4字节而不是100字节
}
|
演示样例7-3-3(b) 数组退化为指针
7.4指针參数是怎样传递内存的?
假设函数的參数是一个指针,不要指望用该指针去申请动态内存。演示样例7-4-1中,Test函数的语句GetMemory(str, 200)并没有使str获得期望的内存,str依然是NULL,为什么?
void GetMemory(char *p, int num)
{
p = (char *)malloc(sizeof(char) * num);
}
|
void Test(void)
{
char *str = NULL;
GetMemory(str, 100); // str 仍然为 NULL
strcpy(str, "hello"); // 执行错误
}
|
演示样例7-4-1 试图用指针參数申请动态内存
毛病出在函数GetMemory 中。编译器总是要为函数的每一个參数制作暂时副本,指针參数p的副本是 _p,编译器使 _p = p。假设函数体内的程序改动了_p的内容,就导致參数p的内容作对应的改动。这就是指针能够用作输出參数的原因。在本例中,_p申请了新的内存,仅仅是把 _p所指的内存地址改变了,可是p丝毫未变。所以函数GetMemory并不能输出不论什么东西。其实,每运行一次GetMemory就会泄露一块内存,由于没实用free释放内存。
假设非得要用指针參数去申请内存,那么应该改用“指向指针的指针”,见演示样例7-4-2。
void GetMemory2(char **p, int num)
{
*p = (char *)malloc(sizeof(char) * num);
}
|
void Test2(void)
{
char *str = NULL;
GetMemory2(&str, 100); // 注意參数是 &str,而不是str
strcpy(str, "hello");
cout<< str << endl;
free(str);
}
|
演示样例7-4-2用指向指针的指针申请动态内存
因为“指向指针的指针”这个概念不easy理解,我们能够用函数返回值来传递动态内存。这样的方法更加简单,见演示样例7-4-3。
char *GetMemory3(int num)
{
char *p = (char *)malloc(sizeof(char) * num);
return p;
}
|
void Test3(void)
{
char *str = NULL;
str = GetMemory3(100);
strcpy(str, "hello");
cout<< str << endl;
free(str);
}
|
演示样例7-4-3 用函数返回值来传递动态内存
用函数返回值来传递动态内存这样的方法尽管好用,可是经常有人把return语句用错了。这里强调不要用return语句返回指向“栈内存”的指针,由于该内存在函数结束时自己主动消亡,见演示样例7-4-4。
char *GetString(void)
{
char p[] = "hello world";
return p; // 编译器将提出警告
}
|
void Test4(void)
{
char *str = NULL;
str = GetString(); // str 的内容是垃圾
cout<< str << endl;
}
|
演示样例7-4-4 return语句返回指向“栈内存”的指针
用调试器逐步跟踪Test4,发现运行str = GetString语句后str不再是NULL指针,可是str的内容不是“hello world”而是垃圾。
假设把演示样例7-4-4改写成演示样例7-4-5,会怎么样?
char *GetString2(void)
{
char *p = "hello world";
return p;
}
|
void Test5(void)
{
char *str = NULL;
str = GetString2();
cout<< str << endl;
}
|
演示样例7-4-5 return语句返回常量字符串
函数Test5 执行尽管不会出错,可是函数GetString2的设计概念却是错误的。由于GetString2内的“hello world”是常量字符串,位于静态存储区,它在程序生命期内恒定不变。不管什么时候调用GetString2,它返回的始终是同一个“仅仅读”的内存块。
别看free和delete的名字恶狠狠的(尤其是delete),它们仅仅是把指针所指的内存给释放掉,但并没有把指针本身干掉。
用调试器跟踪演示样例7-5,发现指针p被free以后其地址仍然不变(非NULL),仅仅是该地址相应的内存是垃圾,p成了“野指针”。假设此时不把p设置为NULL,会让人误以为p是个合法的指针。
假设程序比較长,我们有时记不住p所指的内存是否已经被释放,在继续使用p之前,一般会用语句if (p != NULL)进行防错处理。非常遗憾,此时if语句起不到防错作用,由于即便p不是NULL指针,它也不指向合法的内存块。
char *p = (char *) malloc(100);
strcpy(p, “hello”);
free(p); // p 所指的内存被释放,可是p所指的地址仍然不变
…
if(p != NULL) // 没有起到防错作用
{
strcpy(p, “world”); // 出错
}
|
演示样例7-5 p成为野指针
7.6 动态内存会被自己主动释放吗?
函数体内的局部变量在函数结束时自己主动消亡。非常多人误以为演示样例7-6是正确的。理由是p是局部的指针变量,它消亡的时候会让它所指的动态内存一起完蛋。这是错觉!
void Func(void)
{
char *p = (char *) malloc(100); // 动态内存会自己主动释放吗?
}
|
演示样例7-6 试图让动态内存自己主动释放
我们发现指针有一些“似是而非”的特征:
(1)指针消亡了,并不表示它所指的内存会被自己主动释放。
(2)内存被释放了,并不表示指针会消亡或者成了NULL指针。
这表明释放内存并非一件能够草率对待的事。或许有人不服气,一定要找出能够草率行事的理由:
假设程序终止了执行,一切指针都会消亡,动态内存会被操作系统回收。既然如此,在程序临终前,就能够不必释放内存、不必将指针设置为NULL了。最终能够偷懒而不会错误发生了吧?
想得美。假设别人把那段程序取出来用到其他地方怎么办?
7.7 杜绝“野指针”
“野指针”不是NULL指针,是指向“垃圾”内存的指针。人们一般不会错用NULL指针,由于用if语句非常easy推断。可是“野指针”是非常危急的,if语句对它不起作用。
“野指针”的成因主要有两种:
(1)指针变量没有被初始化。不论什么指针变量刚被创建时不会自己主动成为NULL指针,它的缺省值是随机的,它会乱指一气。所以,指针变量在创建的同一时候应当被初始化,要么将指针设置为NULL,要么让它指向合法的内存。比如
char *p = NULL;
char *str = (char *) malloc(100);
(2)指针p被free或者delete之后,没有置为NULL,让人误以为p是个合法的指针。參见7.5节。
(3)指针操作超越了变量的作用范围。这样的情况让人防不胜防,演示样例程序例如以下:
class A
{
public:
void Func(void){ cout << “Func of class A” << endl; }
};
void Test(void)
{
A *p;
{
A a;
p = &a; // 注意 a 的生命期
}
p->Func(); // p是“野指针”
}
函数Test在执行语句p->Func()时,对象a已经消失,而p是指向a的,所以p就成了“野指针”。但奇怪的是我执行这个程序时竟然没有出错,这可能与编译器有关。
7.8 有了malloc/free为什么还要new/delete ?
malloc与free是C++/C语言的标准库函数,new/delete是C++的运算符。它们都可用于申请动态内存和释放内存。
对于非内部数据类型的对象而言,光用maloc/free无法满足动态对象的要求。对象在创建的同一时候要自己主动运行构造函数,对象在消亡之前要自己主动运行析构函数。因为malloc/free是库函数而不是运算符,不在编译器控制权限之内,不可以把运行构造函数和析构函数的任务强加于malloc/free。
因此C++语言须要一个能完毕动态内存分配和初始化工作的运算符new,以及一个能完毕清理与释放内存工作的运算符delete。注意new/delete不是库函数。
我们先看一看malloc/free和new/delete怎样实现对象的动态内存管理,见演示样例7-8。
class Obj
{
public :
Obj(void){ cout << “Initialization” << endl; }
~Obj(void){ cout << “Destroy” << endl; }
void Initialize(void){ cout << “Initialization” << endl; }
void Destroy(void){ cout << “Destroy” << endl; }
};
|
void UseMallocFree(void)
{
Obj *a = (obj *)malloc(sizeof(obj)); // 申请动态内存
a->Initialize(); // 初始化
//…
a->Destroy(); // 清除工作
free(a); // 释放内存
}
|
void UseNewDelete(void)
{
Obj *a = new Obj; // 申请动态内存而且初始化
//…
delete a; // 清除而且释放内存
}
|
演示样例7-8 用malloc/free和new/delete怎样实现对象的动态内存管理
类Obj的函数Initialize模拟了构造函数的功能,函数Destroy模拟了析构函数的功能。函数UseMallocFree中,因为malloc/free不能运行构造函数与析构函数,必须调用成员函数Initialize和Destroy来完毕初始化与清除工作。函数UseNewDelete则简单得多。
所以我们不要企图用malloc/free来完毕动态对象的内存管理,应该用new/delete。因为内部数据类型的“对象”没有构造与析构的过程,对它们而言malloc/free和new/delete是等价的。
既然new/delete的功能全然覆盖了malloc/free,为什么C++不把malloc/free淘汰出局呢?这是由于C++程序常常要调用C函数,而C程序仅仅能用malloc/free管理动态内存。
假设用free释放“new创建的动态对象”,那么该对象因无法运行析构函数而可能导致程序出错。假设用delete释放“malloc申请的动态内存”,理论上讲程序不会出错,可是该程序的可读性非常差。所以new/delete必须配对使用,malloc/free也一样。
7.9 内存耗尽怎么办?
假设在申请动态内存时找不到足够大的内存块,malloc和new将返回NULL指针,宣告内存申请失败。通常有三种方式处理“内存耗尽”问题。
(1)推断指针是否为NULL,假设是则立即用return语句终止本函数。比如:
void Func(void)
{
A *a = new A;
if(a == NULL)
{
return;
}
…
}
(2)推断指针是否为NULL,假设是则立即用exit(1)终止整个程序的执行。比如:
void Func(void)
{
A *a = new A;
if(a == NULL)
{
cout << “Memory Exhausted” << endl;
exit(1);
}
…
}
(3)为new和malloc设置异常处理函数。比如Visual C++能够用_set_new_hander函数为new设置用户自定义的异常处理函数,也能够让malloc享用与new同样的异常处理函数。具体内容请參考C++使用手冊。
上述(1)(2)方式使用最普遍。假设一个函数内有多处须要申请动态内存,那么方式(1)就显得力不从心(释放内存非常麻烦),应该用方式(2)来处理。
非常多人不忍心用exit(1),问:“不编写出错处理程序,让操作系统自己解决行不行?”
不行。假设发生“内存耗尽”这种事情,一般说来应用程序已经无药可救。假设不用exit(1) 把坏程序杀死,它可能会害死操作系统。道理如同:假设不把歹徒击毙,歹徒在老死之前会犯下很多其它的罪。
有一个非常重要的现象要告诉大家。对于32位以上的应用程序而言,不管如何使用malloc与new,差点儿不可能导致“内存耗尽”。我在Windows 98下用Visual C++编写了測试程序,见演示样例7-9。这个程序会无休止地执行下去,根本不会终止。由于32位操作系统支持“虚存”,内存用完了,自己主动用硬盘空间顶替。我仅仅听到硬盘嘎吱嘎吱地响,Window 98已经累得对键盘、鼠标毫无反应。
我能够得出这么一个结论:对于32位以上的应用程序,“内存耗尽”错误处理程序毫无用处。这下可把Unix和Windows程序猿们乐坏了:反正错误处理程序不起作用,我就不写了,省了非常多麻烦。
我不想误导读者,必须强调:不加错误处理将导致程序的质量非常差,千万不可因小失大。
void main(void)
{
float *p = NULL;
while(TRUE)
{
p = new float[1000000];
cout << “eat memory” << endl;
if(p==NULL)
exit(1);
}
}
|
演示样例7-9试图耗尽操作系统的内存
函数malloc的原型例如以下:
void * malloc(size_t size);
用malloc申请一块长度为length的整数类型的内存,程序例如以下:
int *p = (int *) malloc(sizeof(int) * length);
我们应当把注意力集中在两个要素上:“类型转换”和“sizeof”。
u malloc返回值的类型是void *,所以在调用malloc时要显式地进行类型转换,将void * 转换成所须要的指针类型。
u malloc函数本身并不识别要申请的内存是什么类型,它仅仅关心内存的总字节数。我们通常记不住int, float等数据类型的变量的确切字节数。比如int变量在16位系统下是2个字节,在32位下是4个字节;而float变量在16位系统下是4个字节,在32位下也是4个字节。最好用下面程序作一次測试:
cout << sizeof(char) << endl;
cout << sizeof(int) << endl;
cout << sizeof(unsigned int) << endl;
cout << sizeof(long) << endl;
cout << sizeof(unsigned long) << endl;
cout << sizeof(float) << endl;
cout << sizeof(double) << endl;
cout << sizeof(void *) << endl;
在malloc的“()”中使用sizeof运算符是良好的风格,但要当心有时我们会昏了头,写出 p = malloc(sizeof(p))这种程序来。
u 函数free的原型例如以下:
void free( void * memblock );
为什么free函数不象malloc函数那样复杂呢?这是由于指针p的类型以及它所指的内存的容量事先都是知道的,语句free(p)能正确地释放内存。假设p是NULL指针,那么free对p不管操作多少次都不会出问题。假设p不是NULL指针,那么free对p连续操作两次就会导致程序执行错误。
运算符new使用起来要比函数malloc简单得多,比如:
int *p1 = (int *)malloc(sizeof(int) * length);
int *p2 = new int[length];
这是由于new内置了sizeof、类型转换和类型安全检查功能。对于非内部数据类型的对象而言,new在创建动态对象的同一时候完毕了初始化工作。假设对象有多个构造函数,那么new的语句也能够有多种形式。比如
class Obj
{
public :
Obj(void); // 无參数的构造函数
Obj(int x); // 带一个參数的构造函数
…
}
void Test(void)
{
Obj *a = new Obj;
Obj *b = new Obj(1); // 初值为1
…
delete a;
delete b;
}
假设用new创建对象数组,那么仅仅能使用对象的无參数构造函数。比如
Obj *objects = new Obj[100]; // 创建100个动态对象
不能写成
Obj *objects = new Obj[100](1);// 创建100个动态对象的同一时候赋初值1
在用delete释放对象数组时,留意不要丢了符号‘[]’。比如
delete []objects; // 正确的使用方法
delete objects; // 错误的使用方法
后者相当于delete objects[0],漏掉了另外99个对象。
我认识不少技术不错的C++/C程序猿,非常少有人能拍拍胸脯说通晓指针与内存管理(包含我自己)。我最初学习C语言时特别怕指针,导致我开发第一个应用软件(约1万行C代码)时没有使用一个指针,全用数组来顶替指针,实在蠢笨得过分。躲避指针不是办法,后来我改写了这个软件,代码量缩小到原先的一半。
我的经验教训是:
(1)越是怕指针,就越要使用指针。不会正确使用指针,肯定算不上是合格的程序猿。
(2)必须养成“使用调试器逐步跟踪程序”的习惯,仅仅有这样才干发现问题的本质。
第8章 C++函数的高级特性
对照于C语言的函数,C++添加?了重载(overloaded)、内联(inline)、const和virtual四种新机制。当中重载和内联机制既可用于全局函数也可用于类的成员函数,const与virtual机制仅用于类的成员函数。
重载和内联肯定有其优点才会被C++语言採纳,可是不能够当成免费的午餐而滥用。本章将探究重载和内联的优点与局限性,说明什么情况下应该採用、不该採用以及要警惕错用。
8.1 函数重载的概念
8.1.1 重载的起源
自然语言中,一个词能够有很多不同的含义,即该词被重载了。人们能够通过上下文来推断该词究竟是哪种含义。“词的重载”能够使语言更加简练。比如“吃饭”的含义十分广泛,人们没有必要每次非得说清楚详细吃什么不可。别迂腐得象孔已己,说茴香豆的茴字有四种写法。
在C ++程序中,能够将语义、功能类似的几个函数用同一个名字表示,即函数重载。这样便于记忆,提高了函数的易用性,这是C++语言採用重载机制的一个理由。比如演示样例8-1-1中的函数EatBeef,EatFish,EatChicken能够用同一个函数名Eat表示,用不同类型的參数加以差别。
void EatBeef(…); // 能够改为 void Eat(Beef …);
void EatFish(…); // 能够改为 void Eat(Fish …);
void EatChicken(…); // 能够改为 void Eat(Chicken …);
|
演示样例8-1-1 重载函数Eat
C++语言採用重载机制的还有一个理由是:类的构造函数须要重载机制。由于C++规定构造函数与类同名(请參见第9章),构造函数仅仅能有一个名字。假设想用几种不同的方法创建对象该怎么办?别无选择,仅仅能用重载机制来实现。所以类能够有多个同名的构造函数。
8.1.2 重载是怎样实现的?
几个同名的重载函数仍然是不同的函数,它们是怎样区分的呢?我们自然想到函数接口的两个要素:參数与返回值。
假设同名函数的參数不同(包含类型、顺序不同),那么easy差别出它们是不同的函数。
假设同名函数不过返回值类型不同,有时能够区分,有时却不能。比如:
void Function(void);
int Function (void);
上述两个函数,第一个没有返回值,第二个的返回值是int类型。假设这样调用函数:
int x = Function ();
则能够推断出Function是第二个函数。问题是在C++/C程序中,我们能够忽略函数的返回值。在这样的情况下,编译器和程序猿都不知道哪个Function函数被调用。
所以仅仅能靠參数而不能靠返回值类型的不同来区分重载函数。编译器依据參数为每一个重载函数产生不同的内部标识符。比如编译器为演示样例8-1-1中的三个Eat函数产生象_eat_beef、_eat_fish、_eat_chicken之类的内部标识符(不同的编译器可能产生不同风格的内部标识符)。
假设C++程序要调用已经被编译后的C函数,该怎么办?
如果某个C函数的声明例如以下:
void foo(int x, int y);
该函数被C编译器编译后在库中的名字为_foo,而C++编译器则会产生像_foo_int_int之类的名字用来支持函数重载和类型安全连接。因为编译后的名字不同,C++程序不能直接调用C函数。C++提供了一个C连接交换指定符号extern“C”来解决问题。比如:
extern “C”
{
void foo(int x, int y);
… // 其他函数
}
或者写成
extern “C”
{
#include “myheader.h”
… // 其他C头文件
}
这就告诉C++编译译器,函数foo是个C连接,应该到库中找名字_foo而不是找_foo_int_int。C++编译器开发商已经对C标准库的头文件作了extern“C”处理,所以我们能够用#include 直接引用这些头文件。
注意并非两个函数的名字同样就能构成重载。全局函数和类的成员函数同名不算重载,由于函数的作用域不同。比如:
void Print(…); // 全局函数
class A
{…
void Print(…); // 成员函数
}
不论两个Print函数的參数是否不同,假设类的某个成员函数要调用全局函数Print,为了与成员函数Print差别,全局函数被调用时应加‘::’标志。如
::Print(…); // 表示Print是全局函数而非成员函数
8.1.3 当心隐式类型转换导致重载函数产生二义性
演示样例8-1-3中,第一个output函数的參数是int类型,第二个output函数的參数是float类型。由于数字本身没有类型,将数字当作參数时将自己主动进行类型转换(称为隐式类型转换)。语句output(0.5)将产生编译错误,由于编译器不知道该将0.5转换成int还是float类型的參数。隐式类型转换在非常多地方能够简化程序的书写,可是也可能留下隐患。
# include <iostream.h>
void output( int x); // 函数声明
void output( float x); // 函数声明
void output( int x)
{
cout << " output int " << x << endl ;
}
void output( float x)
{
cout << " output float " << x << endl ;
}
void main(void)
{
int x = 1;
float y = 1.0;
output(x); // output int 1
output(y); // output float 1
output(1); // output int 1
// output(0.5); // error! ambiguous call, 由于自己主动类型转换
output(int(0.5)); // output int 0
output(float(0.5)); // output float 0.5
}
|
演示样例8-1-3 隐式类型转换导致重载函数产生二义性
8.2 成员函数的重载、覆盖与隐藏
成员函数的重载、覆盖(override)与隐藏非常easy混淆,C++程序猿必需要搞清楚概念,否则错误将防不胜防。
8.2.1 重载与覆盖
成员函数被重载的特征:
(1)同样的范围(在同一个类中);
(2)函数名字同样;
(3)參数不同;
(4)virtualkeyword可有可无。
覆盖是指派生类函数覆盖基类函数,特征是:
(1)不同的范围(分别位于派生类与基类);
(2)函数名字同样;
(3)參数同样;
(4)基类函数必须有virtualkeyword。
演示样例8-2-1中,函数Base::f(int)与Base::f(float)相互重载,而Base::g(void)被Derived::g(void)覆盖。
#include <iostream.h>
class Base
{
public:
void f(int x){ cout << "Base::f(int) " << x << endl; }
void f(float x){ cout << "Base::f(float) " << x << endl; }
virtual void g(void){ cout << "Base::g(void)" << endl;}
};
|
class Derived : public Base
{
public:
virtual void g(void){ cout << "Derived::g(void)" << endl;}
};
|
void main(void)
{
Derived d;
Base *pb = &d;
pb->f(42); // Base::f(int) 42
pb->f(3.14f); // Base::f(float) 3.14
pb->g(); // Derived::g(void)
}
|
演示样例8-2-1成员函数的重载和覆盖
8.2.2 令人迷惑的隐藏规则
本来只差别重载与覆盖并不算困难,可是C++的隐藏规则使问题复杂性陡然添加?。这里“隐藏”是指派生类的函数屏蔽了与其同名的基类函数,规则例如以下:
(1)假设派生类的函数与基类的函数同名,可是參数不同。此时,不论有无virtualkeyword,基类的函数将被隐藏(注意别与重载混淆)。
(2)假设派生类的函数与基类的函数同名,而且參数也同样,可是基类函数没有virtualkeyword。此时,基类的函数被隐藏(注意别与覆盖混淆)。
演示样例程序8-2-2(a)中:
(1)函数Derived::f(float)覆盖了Base::f(float)。
(2)函数Derived::g(int)隐藏了Base::g(float),而不是重载。
(3)函数Derived::h(float)隐藏了Base::h(float),而不是覆盖。
#include <iostream.h>
class Base
{
public:
virtual void f(float x){ cout << "Base::f(float) " << x << endl; }
void g(float x){ cout << "Base::g(float) " << x << endl; }
void h(float x){ cout << "Base::h(float) " << x << endl; }
};
|
class Derived : public Base
{
public:
virtual void f(float x){ cout << "Derived::f(float) " << x << endl; }
void g(int x){ cout << "Derived::g(int) " << x << endl; }
void h(float x){ cout << "Derived::h(float) " << x << endl; }
};
|
演示样例8-2-2(a)成员函数的重载、覆盖和隐藏
据作者考察,非常多C++程序猿没有意识到有“隐藏”这回事。因为认识不够深刻,“隐藏”的发生可谓神出鬼没,经常产生令人迷惑的结果。
演示样例8-2-2(b)中,bp和dp指向同一地址,按理说执行结果应该是同样的,可事实并不是这样。
void main(void)
{
Derived d;
Base *pb = &d;
Derived *pd = &d;
// Good : behavior depends solely on type of the object
pb->f(3.14f); // Derived::f(float) 3.14
pd->f(3.14f); // Derived::f(float) 3.14
// Bad : behavior depends on type of the pointer
pb->g(3.14f); // Base::g(float) 3.14
pd->g(3.14f); // Derived::g(int) 3 (surprise!)
// Bad : behavior depends on type of the pointer
pb->h(3.14f); // Base::h(float) 3.14 (surprise!)
pd->h(3.14f); // Derived::h(float) 3.14
}
|
演示样例8-2-2(b) 重载、覆盖和隐藏的比較
8.2.3 摆脱隐藏
隐藏规则引起了不少麻烦。演示样例8-2-3程序中,语句pd->f(10)的本意是想调用函数Base::f(int),可是Base::f(int)不幸被Derived::f(char *)隐藏了。因为数字10不能被隐式地转化为字符串,所以在编译时出错。
class Base
{
public:
void f(int x);
};
|
class Derived : public Base
{
public:
void f(char *str);
};
|
void Test(void)
{
Derived *pd = new Derived;
pd->f(10); // error
}
|
演示样例8-2-3 因为隐藏而导致错误
从演示样例8-2-3看来,隐藏规则似乎非常愚蠢。可是隐藏规则至少有两个存在的理由:
u 写语句pd->f(10)的人可能真的想调用Derived::f(char *)函数,仅仅是他误将參数写错了。有了隐藏规则,编译器就能够明白指出错误,这未必不是好事。否则,编译器会静悄悄地将错就错,程序猿将非常难发现这个错误,流下祸根。
u 假如类Derived有多个基类(多重继承),有时搞不清楚哪些基类定义了函数f。假设没有隐藏规则,那么pd->f(10)可能会调用一个出乎意料的基类函数f。虽然隐藏规则看起来不怎么有道理,但它的确能消灭这些意外。
演示样例8-2-3中,假设语句pd->f(10)一定要调用函数Base::f(int),那么将类Derived改动为例如以下就可以。
class Derived : public Base
{
public:
void f(char *str);
void f(int x) { Base::f(x); }
};
8.3 參数的缺省值
有一些參数的值在每次函数调用时都同样,书写这种语句会使人厌烦。C++语言採用參数的缺省值使书写变得简洁(在编译时,缺省值由编译器自己主动插入)。
參数缺省值的使用规则:
l 【规则8-3-1】參数缺省值仅仅能出如今函数的声明中,而不能出如今定义体中。
比如:
void Foo(int x=0, int y=0); // 正确,缺省值出如今函数的声明中
void Foo(int x=0, int y=0) // 错误,缺省值出如今函数的定义体中
{
…
}
为什么会这样?我想是有两个原因:一是函数的实现(定义)本来就与參数是否有缺省值无关,所以没有必要让缺省值出如今函数的定义体中。二是參数的缺省值可能会改动,显然改动函数的声明比改动函数的定义要方便。
l 【规则8-3-2】假设函数有多个參数,參数仅仅能从后向前挨个儿缺省,否则将导致函数调用语句怪模怪样。
正确的示比例如以下:
void Foo(int x, int y=0, int z=0);
错误的示比例如以下:
void Foo(int x=0, int y, int z=0);
要注意,使用參数的缺省值并没有赋予函数新的功能,不过使书写变得简洁一些。它可能会提高函数的易用性,可是也可能会减少函数的可理解性。所以我们只能适当地使用參数的缺省值,要防止使用不当产生负面效果。演示样例8-3-2中,不合理地使用參数的缺省值将导致重载函数output产生二义性。
#include <iostream.h>
void output( int x);
void output( int x, float y=0.0);
|
void output( int x)
{
cout << " output int " << x << endl ;
}
|
void output( int x, float y)
{
cout << " output int " << x << " and float " << y << endl ;
}
|
void main(void)
{
int x=1;
float y=0.5;
// output(x); // error! ambiguous call
output(x,y); // output int 1 and float 0.5
}
|
演示样例8-3-2 參数的缺省值将导致重载函数产生二义性
8.4.1 概念
在C++语言中,能够用keywordoperator加上运算符来表示函数,叫做运算符重载。比如两个复数相加函数: