C++ 函数调用栈分布详解
作为 C++开发人员,有必要来了解一下 C++函数调用时的栈分布情况,对深入理解 C++函数调用机制及汇编代码是很有好处的。在了解了函数调用的栈分布之后,才能搞懂函数调用堆栈回溯的原理。
1、函数调用的栈分布
假设 A 函数调用 B 函数,B 函数只有一个参数,函数调用时涉及到的入栈操作、栈底指针 ebp 和栈顶指针 esp 的处理如下图所示:
上述函数调用的大致过程为:先将传给 B 函数的参数入栈,接着调用 Call 指令(Call 指令涉及两步:将返回地址(下条指令的地址)压入栈,即返回地址是 Call 指令自动压入到栈中的,然后 jump 到被调用的函数地址),然后保存主调函数 A 的栈基址 ebp,以及保护现场需要的其他寄存器,进入到 B 函数。B 函数调用完成后,将栈顶指针 ebp 及其他寄存器值都 pop 出来,然后调用 ret 指令(将返回地址 pop 出来,然后 jump 到 A 函数中返回地址),最后将调用函数的参数栈清掉。
ebp - 函数栈基址寄存器,esp - 函数栈顶地址寄存器。函数占用的栈空间(地址范围)就在 esp 中的栈顶地址到 ebp 中的栈基址之间,函数的栈空间在函数入口处就进行分配了。
2、关于 call 指令和 ret 指令的说明
简单地说,call 指令会跳转到制定的地址处执行,并将下一条指令入;ret 指令会退出当前函数,并从栈中取出下一条指令放到 IP 寄存器中,继续执行。
CPU 执行 call 指令和 ret 指令的具体过程如下:
1)call 指令:CPU 将 call s 指令的机器码读入,IP 寄存器指向了 call s 后的指令(函数调用的返回地址),然后 CPU 执行 call s 指令,将当前的 IP 寄存器的值压栈(push 压栈操作会减 esp),并将 IP 寄存器值改变为标号 s 处的偏移地址(即 call 指令中的函数地址);
2)ret 指令:CPU 将 ret 指令的机器码读入,IP 寄存器指向了 ret 指令后的内存单元,然后 CPU 执行 ret 指令,从栈中弹出函数执行完后的返回地址(pop 出栈操作会加 esp),送入 IP 寄存器中。然后再执行 IP 寄存器中的指令,即返回地址,即调用函数下面的下一条指令。
此外,EIP 寄存器是用来存放下一个 CPU 指令的地址(代码段地址),当 CPU 执行完当前指令后,从 EIP 寄存器中读取下一条指令的内存地址,然后继续执行。
3、查看函数调用时的汇编代码
编写简单的 C++代码,查看函数调用时的汇编指令调用情况。下面再 main 函数中调用 Add 函数实现两数相加:
然后在代码中设置断点,启动调试,进入调试状态,然后点击菜单栏的 Debug->Windows->DisAssambly 即可看到 C++代码对应的汇编代码了,如下所示:
进入汇编代码页面,点击右键,在弹出菜单中点击“转到源代码”即可进入 C++源码页面。
对照着最上面的函数调用分布图,仔细看一下函数调用相关的汇编代码,就很容理解了。
版权声明: 本文为 InfoQ 作者【dvlinker】的原创文章。
原文链接:【http://xie.infoq.cn/article/609a01b88db9ba8c8a9f0b2a6】。未经作者许可,禁止转载。
评论