> 文章列表 > 【C语言】 程序员的自我修养之(程序编译过程)

【C语言】 程序员的自我修养之(程序编译过程)

【C语言】 程序员的自我修养之(程序编译过程)

【C语言】 程序员的自我修养之(程序编译过程)

在ANSI C(标准C)的任何一种实现中,存在两个不同的环境。

  • 第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令。
  • 第2种是执行环境,它用于实际执行代码。

今天我们就讲解他们在这环境过程都做了什么。

文章目录

  • 详解编译+链接
    • 翻译环境
    • 编译本身也分为几个阶段
    • 总结
  • 运行环境

详解编译+链接

翻译环境

程序的编译大概过程
【C语言】 程序员的自我修养之(程序编译过程)

在VS编译上一个项目中可能存在多个.c.h的源文件,他们都会单独经过编译器(cl.exe)生成自己的目标文件(.obj).在经过链接器(link.exe)和链接库生成 可执行程序(.exe)

【C语言】 程序员的自我修养之(程序编译过程)

  • 组成一个程序的每个源文件通过编译过程分别转换成目标代码(object code)。
  • 每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序。
  • 链接器同时也会引入标准C函数库中任何被该程序所用到的函数,而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中。

编译本身也分为几个阶段

接下来我们就讲解编译环境如何一步一步形成我们的可执行程序的

VS是一个集成开发环境,集成很多的功能
ctrl+F5
不方便观察每个细节的功能
接下来,我使用这个vscode gcc编译器给大家演示

编译本身也分为几个阶段
【C语言】 程序员的自我修养之(程序编译过程)

(test.c) 源文件 -> 翻译环境 -> test.exe -> 可执行程序
而翻译环境分为几个两个阶段

  1. 编译(编译器)
    而编译又划分3个阶段
  1. 预编译
  2. 编译
  3. 汇编
  1. 链接 (链接器)
    合并段表
    符号表的合并和重定位

【C语言】 程序员的自我修养之(程序编译过程)

那我们接下来看看预编译会发生什么事情;

  1. 输入gcc test.c -E (打开预编译) -o test,i (-o输出到test.i)上
    【C语言】 程序员的自我修养之(程序编译过程)
    此时tesri.i存放的是指向这些数据(这些数据好像我们都不认识)其实这是我们# include<stdio.h>头文件的展开【C语言】 程序员的自我修养之(程序编译过程)> 我们划到最后看此时放的是我们自己写的代码【C语言】 程序员的自我修养之(程序编译过程)

此时我们发现预处理阶段会把我们的头文件展开

  1. 我们在次修改下代码
    【C语言】 程序员的自我修养之(程序编译过程)
  • 我们再次打开预处理gcc test.c -E (打开预编译) -o test,i (-o输出到test.i)。 我们划到最后再看下代码【C语言】 程序员的自我修养之(程序编译过程)
    我们发现#define和注释都不见了,define给代替了

所以我们预处理处理的事情是

  1. 头文件的包含
    #include
  2. 注释的删除
  3. #define 定义的符号的替换

在预处理阶段很多事情都与预处理的指令相关。
比如:
#define
#include
#pragmapack


那我们再看看编译阶段会发生什么:

  1. 输入gcc -S test.c 这时候我们会生成一个test.S的文件,该文件就是编译文件
    【C语言】 程序员的自我修养之(程序编译过程)
    我们打开test.S放的是什么
    【C语言】 程序员的自我修养之(程序编译过程)
    test.S 放的是汇编指令
  • 编译时我们会把C语言代码转换成汇编指令
    其实更细的说在这编译期间转换成汇编指令期间,还会处理
    1 语法分析
    2 词法分析
    3 语义分析
    4 符号汇总

那汇编译阶段又会发生什么:

输入gcc -c test.c 此时会生成一个(test.o)文件,目标文件
vs是生成为.obj文件
gcc是生成.o文件
【C语言】 程序员的自我修养之(程序编译过程)

  • 此时我们想看test.o文件,会发现该文件无法打开
    【C语言】 程序员的自我修养之(程序编译过程)
    因为此时已经把汇编代码转换成二进制的指令了,并且还会形成符号表

  • 链接时会 合并段表,符号表的合并和重定位
  • 汇编译阶段时会形成符号表

那他们有什么关系呢 图解:
符号汇总-> 形成符号表 -> 符号表的合并和重定位 -> 可执行程序
【C语言】 程序员的自我修养之(程序编译过程)

重定符号表又有什么用呢?其实很好理解

比如把add.c文件的add函数删掉,重定符号表时还会取到下面那个Add 0x000 无效地址,真正在链接时找这个函数时就会报错。
【C语言】 程序员的自我修养之(程序编译过程)
你只是在声明这个函数,但是这个函数地址并没有真实存在

其实 合并段表,形成符号表,符号表的合并和重定位,他重新为链接期间这个跨源文件的代码进行协作时候在做铺垫

【C语言】 程序员的自我修养之(程序编译过程)


总结

  1. 预处理 选项 gcc -E test.c -o test.i
    预处理完成之后就停下来,预处理之后产生的结果都放在test.i文件中。
  2. 编译 选项 gcc -S test.c
    编译完成之后就停下来,结果保存在test.s中。
  3. 汇编 gcc -c test.c
    汇编完成之后就停下来,结果保存在test.o中。

【C语言】 程序员的自我修养之(程序编译过程)
【C语言】 程序员的自我修养之(程序编译过程)


运行环境

程序执行的过程:

  1. 程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序
    的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
  2. 程序的执行便开始。接着便调用main函数。
  3. 开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回
    地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程
    一直保留他们的值。
  4. 终止程序。正常终止main函数;也有可能是意外终止。