C程序的源代码中可包括各种编译指令,这些指令称为预处理命令。虽然它们实际上不是C语言的一部分,但却扩展了C程序设计的环境。本节将介绍如何应用预处理程序和注释简化程序开发过程,并提高程序的可读性。
4.7.1C语言的预处理程序
ANSI标准定义的C语言预处理程序包括下列命令:
#define
#error
#include
#if
#else
#elif
#endif
#ifdef
#ifndef
#undef
#line
#pragma
非常明显,所有预处理命令均以符号#开头,下面分别加以介绍。
4.7.2#define
命令#define定义了一个标识符及一个串。在源程序中每次遇到该标识符时,均以定义的串代换它。ANSI标准将标识符定义为宏名,将替换过程称为宏替换。命令的一般形式为:
#define identifier string
注意,该语句没有分号。在标识符和串之间可以有任意个空格,串一旦开始,仅由一新行结束。
例如,如希望TURE取值1,FALSE取值0,可说明两个宏#define
#define TURE 1
#define FALSE 0
这使得在源程序中每次遇到TURE或FALSE就用0或1代替。
例如,在屏幕上打印“012”:
printf("%d%d%d",FALSE,TRUE,TRUE+1);
宏名定义后,即可成为其它宏名定义中的一部分。例如,下面代码定义了ONE、TWO及THREE的值。
#define ONE 1
#define TWO ONE+ONE
#define THREE ONE+TWO
懂得宏替换仅仅是以串代替标识符这点很重要。因此,如果希望定义一个标准错误信息,可编写如下代码:
#defineE_MS"standard error on input\n"
printf(E_MS);
编译程序遇到标识符E_MS时,就用“standard error on input\n”替换。对于编译程序,printf()语句实际是如下形式:
printf("standard error on input\n;")
如果在串中含有标识符,则不进行替换。例如:
#define XYZ this is a test
.
.
.
printf("XYZ");
该段不打印"this is a test"而打印"XYZ"。
如果串长于一行,可以在该行末尾用一反斜杠续行,例如:
#defineLONG_STRING"this is a very long\
string that is used as an example"
C语言程序普遍使用大写字母定义标识符。这种约定可使人读程序时很快发现哪里有宏替换。最好是将所有的#define放到文件的开始处或独立的文件中(用#include访问),而不是将它们分散到整个程序中。
宏代换的最一般用途是定义常量的名字和程序中的“游戏数”。例如,某一程序定义了一个数组,而它的几个子程序要访问该数组,不应直接以常量定数组大小,最好是用名字定义之(需改变数组大小时)。
#define MAX_SIZE100
float balance [MAX_SIZE;]
#define命令的另一个有用特性是,宏名可以取参量。每次遇到宏名时,与之相连的形参均由程序中的实参代替。例如:
当编译该程序时,由MIN(a,b)定义的表达式被替换,x和y用作操作数,即printf()语句被代换后取如下形式:
printf("the minimum is:%,d"(x<y)?x:y);
用宏代换代替实在的函数的一大好处是宏替换增加了代码的速度,因为不存在函数调用的开销。但增加速度也有代价:由于重复编码而增加了程序长度。
4.7.3#error
处理器命令#error强迫编译程序停止编译,主要用于程序调试。
4.7.4#include
命令#include使编译程序将另一源文件嵌入带有#include的源文件,被读入的源文件必须用双引号或尖括号括起来。例如:
#include"stdio.h"
#include<stdio.h>
这两行代码均使用C编译程序读入并编译用于处理磁盘文件库的子程序。
将文件嵌入#include命令中的文件内是可行的,这种方式称为嵌套的嵌入文件,嵌套层次依赖于具体实现。
如果显式路径名为文件标识符的一部分,则仅在哪些子目录中搜索被嵌入文件。否则,如果文件名用双引号括起来,则首先检索当前工作目录。如果未发现文件,则在命令行中说明的所有目录中搜索。如果仍未发现文件,则搜索实现时定义的标准目录。
如果没有显式路径名且文件名被尖括号括起来,则首先在编译命令行中的目录内检索。
如果文件没找到,则检索标准目录,不检索当前工作目录。
4.7.5条件编译命令
有几个命令可对程序源代码的各部分有选择地进行编译,该过程称为条件编译。商业软件公司广泛应用条件编译来提供和维护某一程序的许多顾客版本。
1.#if、#else,#elif及#endif
#if的一般含义是如果#if后面的常量表达式为true,则编译它与#endif之间的代码,否则跳过这些代码。命令#endif标识一个#if块的结束,参见例4-13。
#ifconstant-expression
statement sequence
#endif
由于MAX大于99,以上程序在屏幕上显示一串消息。该例说明了一个重点:跟在#if后面的表达式在编译时求值,因此它必须仅含常量及已定义过的标识符,不可使用变量。表达式不许含有操作符sizeof。
#else命令的功能有点象C语言中的else;#else建立另一选择(在#if失败的情况下)。因而上面的例子可扩充,参见例4-14。
在此例中,因为M A X小于9 9,所以,不编译#if块,而是编译# else块,因此,屏幕上显
示"compiled for small array"这一消息。
注意,# else 既是# if 块又是#else 块头。这是因为任何#if 仅有一个#endif。
#elif命令意义与ELSE IF 相同,它形成一个if else-if阶梯状语句,可进行多种编译选择。
#elif 后跟一个常量表达式。如果表达式为t r u e,则编译其后的代码块,不对其它#elif表达式进
行测试。否则,顺序测试下一块。
#if expression
statement sequence
#elif expression1
statement sequence
#elif expression2
statement sequence
#elif expression3
statement sequence
#elif expression4
#elif expression3N
statement sequence
#endif
例如:下面程序利用ACTI Ve_ COUNTRY定义货币符号。
#define US 0
#define ENGLAND1
#define FRANCE 2
# define ACTIVE_COUNTRY US
#if ACTIVE_COUNTRY = = US
char currency[ ]="dollar; "
#elif ACTIVE_COUNTRY= =ENGLAND
char currency[ ]="pound; "
#else
char currency[ ]="franc;"
#endif
#if与#elif命令可能一直嵌套到实现规定的权限,其中#endif、#else或#elif与最近#if或#elif关联。例如,下面程序是完全有效的。
#if MAX>100
#if SERIAL_VERSION
int port=198;
#elif
int port=200;
#elif
#else
char out_buffer[100];
#endif
2. # ifdef 和# ifndef
条件编译的另一种方法是用#ifdef与#ifndef命令,它们分别表示“如果有定义”及“如果无定义”。
# ifdef的一般形式是:
# ifdef macroname
statement sequence
#endif
如果宏名在前面# def i n e语句中已定义过,则该语句后的代码块被编译。
#ifndef的一般形式是:
#ifndef macroname
statement sequence
#endif
如果宏名在#define 语句中无定义,则编译该代码块。
#ifdel 与#ifndef可以用于#else 语句中,但#elif 不行。参见4 - 1 5。
上述代码打印“ Hi Ted ”及“ RALPH not defined”。如果T E D没有定义,则显示“ H i a n y o n e”,后面是“ RALPH not defined”。
可以像嵌套#if 那样将#ifdef 与#ifndef 嵌套至任意深度。
4.7.6 #undef
命令#undef 取消其后那个前面已定义过有宏名定义。一般形式为:
#undef macroname
例如:
# define LEN 100
#difine WIDTH 100
char array[LEN][WIDTH];
# undef LEN
# undef WIDTH
/ *at this point both LEN and WIDTH are undefined * /
直到遇到#undef 语句之前, L E N与W I D T H均有定义。
# undef 的主要目的是将宏名局限在仅需要它们的代码段中。
4.7.7 #line
命令# line改变_LINE_ 与_ F I L E _的内容,它们是在编译程序中预先定义的标识符。
命令的基本形式如下:
# line number["filename"]
其中的数字为任何正整数,可选的文件名为任意有效文件标识符。行号为源程序中当前行号,文件名为源文件的名字。命令# line主要用于调试及其它特殊应用。
例如,下面说明行计数从1 0 0开始;printf( ) 语句显示数1 0 2,因为它是语句#line 100后的第3行。
#line 100 /* 初始化行计数器* /
main ( ) /* 行号100 */
{ /* 行号101 */
p r i n t f ( " % d \ n " ,_ line _ ) ; /* 行号102 */
}
4.7.8 #pragma
命令#pragma 为实现时定义的命令,它允许向编译程序传送各种指令。例如,编译程序可能有一种选择,它支持对程序执行的跟踪。可用# p r a g m a语句指定一个跟踪选择。
4.7.9 预定义的宏名
A N S I标准说明了五个预定义的宏名。它们是:
_ line _
_ F I L E _
_ D A T E _
_ T I M E _
_ S T D C _
如果编译不是标准的,则可能仅支持以上宏名中的几个,或根本不支持。记住编译程序也许还提供其它预定义的宏名。
_ line _及_ F I L E _宏指令在有关# line的部分中已讨论,这里讨论其余的宏名。
_ D AT E _宏指令含有形式为月/日/年的串,表示源文件被翻译到代码时的日期。
源代码翻译到目标代码的时间作为串包含在_ T I M E _中。串形式为时:分:秒。
如果实现是标准的,则宏_ S T D C _含有十进制常量1。如果它含有任何其它数,则实现是非标准的。
注意:宏名的书写由标识符与两边各二条下划线构成。
4.7.10 注释
在C语言中,所有的注释由字符/ *开始,以* /结束。在星号及斜杠之间不允许有空格。编译程序忽略注释开始符到注释结束符间的任何文本。例如,下面程序在屏幕上只打印
“h e l l o”。
main ()
{
p r i n t f ( "hello" ) ;
/*printf ("This is a sample to print hell;o"*/)
}
注释可出现在程序的任何位置,但它不能出现在关键字或标识符中间。
即,注释x=10+ /*add the numbers */ 5;是有效的,但swi/* this will not work */tch(c){...
是不正确的,因为C的关键字不能含有注释。通常也不希望表达式中间出现注释,因为这会使
意义含混不清。
注释不可嵌套,即一个注释内不可含有另一个注释。例如,下面代码段在编译时出错:
/*this is an outer comment
x = y / a ;
/*this is an inner comment -and causes an error */
* /
当需要解释程序的行为时,注释应简明扼要。除了最简单和最直观的函数外,都应有注释,在函数开始处说明其功能,如何调用以及返回何处。