写点什么

【精通内核】计算机程序的执行原理深度解析

  • 2022 年 8 月 13 日
    上海
  • 本文字数:3252 字

    阅读完需:约 11 分钟

前言

📫作者简介小明java问道之路,专注于研究计算机底层/Java/Liunx 内核,就职于大型金融公司后端高级工程师,擅长交易领域的高安全/可用/并发/性能的架构设计📫 

🏆CSDN 专家博主/Java 领域优质创作者、阿里云专家博主、华为云享专家、51CTO 专家博主🏆

🔥如果此文还不错的话,还请👍关注、点赞、收藏三连支持👍一下博主~


本文导读

了解过 ELF 文件内容,我们知道程序由各种段组成,仅仅了解程序的组成还不够,本讲深入计算机程序(包含 C/C++、Java、Python 等等)所有语言的执行原理,同时了解在 ELF 文件中将内存布局地址,CPU 是如何执行指令的,C 语言中方法的执行过程的内核调用。

一、程序虚拟地址空间布局

在介绍 ELF 文件内容时,我们知道程由各种段组成,同时在 LF 件中将内存布地址都已经描述完成。程序读取到内存中后,根据 ELF 的描述,决定是否执行动态链接。最后生成的程序布局图如图所示。

寻址空间为 4GB 的内存模型图,这里的地址空间是虚拟地址空间,底层的线性地址分段和物理地址分页,上层是无感知的。可以看到,每个程序的虚拟地址空间最高 1GB 处都是操作系统的内核映射,这是因为不管程序如何映射,都需要一段虚拟地址空间用于映射内核,这样我们才能通过系统调用访问内核。

整个程序包含如下部分

1、text segment 程序代码段

2、data segment 数据段

3、BSS segment 未初始化的数据段

4、 heap 堆区。由低地址往高地址扩张

5、memory mapping region 其实也属于堆区,只不过这一部分可以通过 mmap 来产生映射

6、stack 程序运行时需要的栈内存,由高地址往低地址扩张


由于内部数据和函数,均在两个连接库中使用绝对地址所以我们将关注点放在全局数据和函数上。由于代码段 .text ,加载到内存中,OS 不允许修改代码段的内容,他只读(保护程序)而对于数据段而言,非 .rodata,其他数据是可读可写的,所以维护表,来存储自己的程序的虚拟地址值。

二、CPU 执行指令原理

我们了解到一个程序通过 gcc 编译,经过预处理里、编译、链接等步骤,最终生成了 ELF 类型的二进制文件。通过反汇编,我们了解到这些文件其实就是之前学过的汇编语言 mov、sub 等,然后结合操作一系列的寄存器完成了整个执行过程。

本节我们就来探究以下两个问题:

CPU 是如何执行指令的?C 语言中方法的执行过程?


这里我们通过 gdb 来调试,并观察整个执行过程。读者需要寄存器。首先通过 gcc -g demo.c 编译源文件,生成 a.out ELF 可执行文件。然后通过 gdb 的断点机制,对 main 函数打上断点,gdb a.out 。

程序成功地停止在断点处,观察此时的寄存器状态

#include<stdio.h> int sum(int a, int b) {	int c = a + b; 	return c;}int main() {	int i = sum(3,3); 	printf("%d",i); 	return 1;}
复制代码


gcc程序寄存器状态值

重点观察 RIP 和 CS 寄存器,此时的 RIP 为 0x40054f,CS 为 0x33。注意,OS 位数为 64 位,所以这里以 R 开头。前面介绍的 16 位为 IP,32 位为 EIP,其他寄存器也是如此。

RIP 为 0x400537,CS 为 0x33,RSI 和 RDI 为 3,即我们传入的参数。接下来继续执行,此时,RIP 为 0x400542,CS 为 0x33,RSI 和 RII 为 3,rax 保存了返回值 6,EFLAGS 变为了 0x206。其实,就是增加了一个 PF(奇偶校验位)。可以看到,RIP 的计数和编译后的 ELF 文件地址一样。这就意味着,编译时就确定了虚拟地址的信息,这也正是虚拟地址→线性地址→物理地址映射的魅力。每个程序都认为自己占有整个内存地址,事实上底层由 OS 结合硬件来进行段表、页表映射。

从上面的分析过程,我们可以得出以下几点信息。

1、CPU 通过 RIP 来获取指令的地址。

2、C 语言程序通过寄存器来传递参数。当然也可以通过栈,如参数太多、寄存器放不下等情况。

3、虚拟地址在 ELF 文件中就已经确定。

4、调用方法的过程中,CS 代表代码段寄存器。启动保护模式后,CS 为段选择子 0x33,可以确定 main 函数和 sum 函数处于同一个段,且变为二进制为 110011。段选择子后面的两位代表着 4 个特权级--0、3。其中,0 代表 OS 特权级,3 用于用户程序,这里正好 11(二进制)为 3。同时,第 3 位表明段信息是 LDT 和 GDT,这里为 0,表明在 GDT 中。其余高 13 位用于在段描述符表中,作为索引查询段基址。

5、执行方法后,发生了改变,从原来的 IF 增加到了 PF、IF。


通过这些观察和结论,我们可以总结 CPU 如何执行程序的:

首先通过 CS 和 IP 寄存器定位到需要执行的指令,然后执行指令,接着根据执行的结果设置 EFLAGS 寄存器,最后在调用方法时通过寄存器或者栈来传递参数,并且在 ELF 文件生成时就已经确定了程序的虚拟地址。

三、C 语言中方法的执行原理

接下来我们研究 C 语言方法的执行过程,我们继续用上面的代码,文字解释过于隐晦,我们用一组图,来描述从 main 函数到 sum 函数的调用过程。

#include<stdio.h> int sum(int a, int b) {	int c = a + b; 	return c;}int main() {	int i = sum(3,3); 	printf("%d",i); 	return 1;}
复制代码

1、下图,为进入 main 函数、开辟空间并调用月 call sum 指令后的状态,因为 call 指令会自动将 call 指令的下一条指令压入栈中,所以才通过 rsp 开辟空间。这里一定要注意,push 指令和 pop 指令都是显示操作栈指针 rsp 的。esi 和 edi 分别是从 C 函数的右到左开始保存参数,edi 为第 1 个参数 3,esi 为第 2 参数 3。

调用call sum指令状态描述

2、下图,为 sum 函数通过操作 rsp 和 rbp 开辟了 sum 函数栈帧的状态。我们可以看到通过将 rsp 和 rbp 设置相等,就得到了一个新的栈,其中 rbp 指向栈底,rsp 指向栈顶。

开辟sum函数栈帧状态描述

3、下图,为 sum 函数执行完成但没有返回的状态。可以看到,操作栈时并没有通过 rsp 栈指针,而是直接通过 rbp 来执行存取运算的。这是可行的,因为我们不需要开辟栈帧,直接操作 rbp 即可,通过 rbp 将局部变量 3 和运算结果放入 sum 函数的栈帧中。其实根本没必要将这些局部变量压栈、出栈,因为我们只是加两个数然后直接返回,但编译器为何这么不聪明呢?答案是没有开启优化。通过 gcc-O 开启优化后,会发现这些都没了。编译器并不是不聪明,而是太听话,完全按照程序写的逻辑来生成对应代码。例如,看到代码“int c=a+b;”,c 是个局部变量量,编译器一定会保存 a+b 的结果。同时,我们看到 eax 寄存器 中保存了返回值 6

sum函数返回前状态描述

4、下图,为 sum 函数执行完成后的状态,可以看到,之前 sum 函数栈帧的数据还存在,但这并不响结果。读者可能会想到一个问题,就是野指针。如果我们其他程序用一个未初始化的指针读取值,就有可能读到这些脏值。需要注意的是,函数返回后,我们需要恢复 main 函数的栈帧,该怎么做呢?必然是将之前保存的 rbp 地址恢复到 rbp 寄存器中,这时 main 函数栈帧的栈底就设置了。然后将 call 指令保存的指令弹出到 rip 寄存中,执行流程就顺利地进入了 call 指令的下一个指令中,即返回 main 函数中。

sum函数返回后状态描述

5、为 main 函数执行后的状态。因为 printf 函数也是 call 指令调用的,所以可以看到之前为什么开辟了 16byte 空间,分别用于保存两个 call 指令的下一条指令地址,并且我们复用了 8byte 的地址用于临时保存变量 6。从汇编代码中可以发现,编译器做了很多我们认为没必要的动作,如返回值入栈、出栈、给 esi 等。再次强调,这不是因为编译器不聪明,而是因为它太听话。读者可以推理,main 函数执行完毕后,通过保存的 rbp 和返回地址,也可以退出 main 的栈帧。

main函数执行后的状态描述

小结:这个过程很烦琐,读者只需要知道以下几点即可

一、C 语言的方法调用,就是保存返回地址,通过操作 rsp 和 rbp 开辟栈帧。

二、参数可以通过 esi 和 edi 寄存器传递。

三、返回值放在 eax 寄存器中。

四、Call 指令会自动地将下一条指令压入程序栈中。

五、Ret 指令自动将 call 压入的返回地址弹出放入 rip 寄存器中,从而达到函数的 return。

总结

我们知道程序由各种段组成,了解在 ELF 文件中将内存布局地址,CPU 通过寄存器执行指令的,C 语言中方法的执行过程,就是 CPU 操作寄存器的过程。同时我们还需要理解 C 语言的方法调用,就是保存返回地址,通过操作 rsp 和 rbp 开辟栈帧。 参数可以通过 esi 和 edi 寄存器传递。返回值放在 eax 寄存器中。 Call 指令会自动地将下一条指令压入程序栈中。 Ret 指令自动将 call 压入的返回地址弹出放入 rip 寄存器中,从而达到函数的 return。

发布于: 刚刚阅读数: 3
用户头像

🏆博客专家 2020.03.20 加入

🏆 CSDN专家博主/Java领域优质创作者、阿里云专家博主、华为云享专家、51CTO专家 📫就职某大型金融互联网公司后端高级工程师 👍专注于研究计算机底层/Java/架构/设计模式/算法

评论

发布
暂无评论
【精通内核】计算机程序的执行原理深度解析_内核_小明Java问道之路_InfoQ写作社区