Android C++ 系列:Linux 进程 (二)
1. fork
子进程复制父进程的 0 到 3g 空间和父进程内核中的 PCB,但 id 号不同。 fork 调用一次返回两次
父进程中返回子进程 ID
子进程中返回 0
读时共享,写时复制
1.1 进程相关函数
getpid/gteppid
getuid
getgid
vfork
用于 fork 后马上调用 exec 函数
父子进程,共用同一地址空间,子进程如果没有马上 exec 而是修改了父进程出得到的变量值,此修改会在父进程中生效
设计初衷,提高系统效率,减少不必要的开销
现在 fork 已经具备读时共享写时复制机制,vfork 逐渐废弃
2. exec 族
用 fork 创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支), 子进程往往要调用一种 exec 函数以执行另一个程序。当进程调用一种 exec 函数时,该进程的 用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用 exec 并不创建 新进程,所以调用 exec 前后该进程的 id 并未改变。
其实有六种以 exec 开头的函数,统称 exec 函数:
这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回,如果调用出错 则返回-1,所以 exec 函数只有出错的返回值而没有成功的返回值。
这些函数原型看起来很容易混,但只要掌握了规律就很好记。不带字母 p(表示 path)的 exec 函数第一个参数必须是程序的相对路径或绝对路径,例如“/bin/ls”或“./ a.out”,而不能是“ls”或“a.out”。对于带字母 p 的函数:
如果参数中包含/,则将其视为路径名。 否则视为不带路径的程序名,在 PATH 环境变量的目录列表中搜索这个程序。 带有字母 l(表示 list)的 exec 函数要求将新程序的每个命令行参数都当作一个参数传
给它,命令行参数的个数是可变的,因此函数原型中有...,...中的最后一个可变参数应该是 NULL,起 sentinel 的作用。对于带有字母 v(表示 vector)的函数,则应该先构造一个指向 各参数的指针数组,然后将该数组的首地址当作参数传给它,数组中的最后一个指针也应该 是 NULL,就像 main 函数的 argv 参数或者环境变量表一样。
对于以 e(表示 environment)结尾的 exec 函数,可以把一份新的环境变量表传给它,其 他 exec 函数仍使用当前的环境变量表执行新程序。
exec 调用举例如下:
事实上,只有 execve 是真正的系统调用,其它五个函数最终都调用 execve,所以 execve 在 man 手册第 2 节,其它函数在 man 手册第 3 节。这些函数之间的关系如下图所示。
一个完整的例子:
由于 exec 函数只有错误返回值,只要返回了一定是出错了,所以不需要判断它的 返回值,直接在后面调用 perror 即可。注意在调用 execlp 时传了两个“ps”参数,第一 个“ps”是程序名,execlp 函数要在 PATH 环境变量中找到这个程序并执行它,而第二 个“ps”是第一个命令行参数,execlp 函数并不关心它的值,只是简单地把它传给 ps 程 序,ps 程序可以通过 main 函数的 argv[0]取到这个参数。
调用 exec 后,原来打开的文件描述符仍然是打开的。利用这一点可以实现 I/O 重定向。 先看一个简单的例子,把标准输入转成大写然后打印到标准输出:
例 upper
例 wrapper
wrapper 程序将命令行参数当作文件名打开,将标准输入重定向到这个文件,然后调用 exec 执行 upper 程序,这时原来打开的文件描述符仍然是打开的,upper 程序只负责从标准输 入读入字符转成大写,并不关心标准输入对应的是文件还是终端。运行结果如下:
l 命令行参数列表
p 搜素 file 时使用 path 变量
v 使用命令行参数数组
e 使用环境变量数组,不使用进程原有的环境变量,设置新加载程序运行的环境变量
3. 总结
本文介绍了进程原语:fork 和 exec。 fork 调用一次返回两次:父进程中返回子进程 ID ;子进程中返回 0;读时共享,写时复制。
版权声明: 本文为 InfoQ 作者【轻口味】的原创文章。
原文链接:【http://xie.infoq.cn/article/63e7bea358c58d98fee659da2】。文章转载请联系作者。
评论