【C语言】预处理和程序环境
目录
程序的环境
运行环境
翻译环境
编译的过程
预编译阶段
编译阶段
汇编阶段
链接阶段(不属于编译阶段)
预处理详解
预定义符号
#define
#define定义标识符
#define定义宏
#define的替换规则
#和##的使用
带副作用的宏参数
宏和函数的对比
一些命名的规则
#undef
命令行的定义
条件编译
常见的条件编译指令
文件包含
总结
程序的环境
在ANSI C的任何一种的实现中,都存在则两个环境。
一个是翻译环境,在这个环境中,源代码被转化为可执行的机器指令。(通过编译器和连接器来进行转换)。
一个是执行环境,它用于实际执行代码。
运行环境
程序必须载入内存中,在有操作系统的环境中:一般这个由操作系统完成。在独立环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
翻译环境
每一个源程序都是单独编译转换成目标文件,每个目标文件通过连接器捆绑在一起,从而形成一个单一而完整的可执行程序 。
同时,连接器会引入标准c函数库中任何被改程序所用到的函数,而且他可以搜索程序员个人的程序库,将其需要的函数也连接到程序中。
编译的过程
编译的过程实际上有三个过程:预编译阶段、编译阶段、汇编阶段。
预编译阶段
主要是处理一些预处理指令。
编译阶段
编译阶段包含四个部分:语法分析、词法分析、语义分析、符号汇总。将代码转换成汇编代码。
其中,对于符号汇总:将全局型的符号收集起来。
汇编阶段
形成符号表、将汇编指令转换成二进制机器指令。
链接阶段(不属于编译阶段)
合并段表,符号表的合并和符号表的重定位。
预处理详解
对于预处理,我们需要了解预定义符号、#define的相关知识、#和##的使用等知识。
预定义符号
__FILE__ :进行编译的源文件%s
__LINE__:文件当前的行号%d
__DATA__:文件被编译的日期%s
__TIME__:文件被编译的时间%s
__STDC__ :如果编译器遵循ANSI C,其值为1,否则未定义。
这些预定义符号都是语言内置的。
#define
#define定义标识符
语法形式:#define name stuff。实际上就是将name 替换成stuff。
#define定义宏
#define 机制包括了一个规定,允许把参数替换到文本当中,这种实现通常称为宏。
宏的申明方式:#define name(parament-list) stuff。
定义宏时要注意的点:参数列表的左括号必须和name紧挨着,要不然会被解析成stuff的一部分。 在定义宏时,我们尽量将参数都带上括号,并且将整个宏用括号括起来,防止因为符号优先级的问题造成我们不想看见的结果。
#define的替换规则
1、在调用宏时,我们首先要对参数进行检查,看看是否包含任何由#define定义的标识符,如果有,它们将首先被替换。
2、替换文本随后被插入到程序中原来文本的位置,对于宏,参数名将被它们的值所替换。
3、最后,再次对文本进行扫描,观察是否还存在#define定义的符号,如果有,重复上面的过程。
4、宏不能出现递归。
5、当预处理器搜索#define定义的符号时,字符串常量的内容并不被搜索。
#和##的使用
#的作用是将一个宏参数转变成对应的字符串。
##的作用是将位于他两边的符号合并成一个符号,它允许宏定义从分离的文本片段创建标识符。
带副作用的宏参数
当宏参数在宏定义中出现不止一次时,如果参数带有副作用,那么在使用这个宏时没有看产生不可预测的后果。
x+1不带副作用
x==带副作用
宏和函数的对比
看完上面讲的,你也许会疑惑,宏和函数好像差不多啊,有什么区别呢?
宏通常被用在执行简单的运算之中,其原因是:用于调用函数和从函数返回的代码可能比实际执行这个小型计算工作所需要的时间更多。函数的参数要求是必须声明为特定类型,所以函数只能在类型合适的表达式上使用,而宏可以适用于不同类型(因为只是替换罢了)。
所以宏比函数在程序的规模和速度方面更胜一筹。
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
但宏也有缺点:1、每次使用宏时,以分红定义的代码将插入到程序中。除非宏比较短、否则可能大幅度增加程序的长度。2、宏是没办法调试的(在预处理阶段就把文本给替换掉了)。
3、宏不够严谨。4、宏可能会带来运算符优先级的问题,导致程序容易出错。
属性 #define定义宏 函数 代码长度 每次使用时,宏代码都会被插入到程序中。出来非常小的宏之外,程序的长度会大幅度增长 函数代码只出现于一个地方,每次使用这个函数时,都调用同一个地方的同一份代码。 执行速度 更快 存在函数的调用和返回的额外开销,所以相对慢一些。 操作符优先级 宏参数的求值是在所有周围表达式的上下文环境里,除非加上括号,否则临近操作符的优先级可能会产生不可预料的后果,所以建议在宏书写的时候多加些括号。 函数参数值在函数调用的时候求值一次,它的结果值传递给函数。表达式的求值结果更容易预测。 带有副作用的参数 参数可能被替换到宏体中的任意位置,所以带有副作用的参数求值可能会产生不可预料的结果 函数参数只在传参的时候求值一次,结果更容易被控制 参数类型 宏的参数和类型无关,只要对参数的操作是合法的,他就可以使用任何类型的参数 函数的参数是与类型有关的,如果参数的类型不同,就需要不同的函数,即使他们执行的内容是相同的(比如算整数相加和算浮点数相加) 调试 宏不能被调试 函数是可以逐语句调试的 递归 宏不能递归 函数是可以递归的
一些命名的规则
我们一般将宏的名字全部大写,函数名不要全部大写。
#undef
这条指令用于移除一个宏定义
#undef name
如果一个现存的一个名字需要被重新定义,那么它的旧名字首先要被移除。
命令行的定义
许多c的编译器提供了一种方法:允许在命令行中定义符号(在启动编译的过程中)
比如定义一个数组int arr【arr_size】;我们可以先不定义arr_size,在编译过程中使用命令上进行定义。
条件编译
如果我们使用条件编译指令,那么在编译一个程序的时候,我们如果要将一条(或者一组) 编译或者放弃是很方便的。
例如调试行的代码,留着碍事,但删除又很可惜,使用我们可以选择使用选择性的编译。
常见的条件编译指令
#if 常量表达式
\\\\语句。。
#endif
多个分支语句的条件编译
#if 常量表达式
//语句
#elif 常量表达式
//语句
#else
//语句
#endif
判断是否被定义的条件编译
#if defined(symbol) (或者写成#ifdef symbol,这俩是等价的)
#if !defined(symbol)(或者写成#ifndef symbol)
嵌套条件编译指令
#if defined(OS_UNIX)
#ifdef OPTION1
unix_version_option1();
#endif
#ifdef OPTION2
unix_version_option2();
#endif
#elif defined(OS_MSDOS)
#ifdef OPTION2
msdos_version_option2();
#endif
文件包含
头文件的引用一般有两种形式,一种是<>,另外一种是“ ”,前一种多用于库函数的头文件引用,后一种多是引用程序员个人写的头文件。
后一种的查找策略:先在原文件所在的目录下查找,如果目标头文件没找到,编译器就像查找库函数头文件一样在标准位置查找头文件,如还没查找到,则提示编译错误。
在引用头文件时,有时候会因为嵌套引用头文件造成头文件的重复引用,进而造成文件内容的重复,我们常常通过条件编译来解决这个问题。
总结
本文介绍了程序环境、编译过程、#define定义的标识符和宏以及相关知识,头文件的应用,预处理的详细解析。