除了运行、休眠…进程居然还有僵尸、孤儿状态
本文分享自华为云社区《僵尸进程?孤儿进程?为什么他有如此惨烈的身世...》,作者: 花想云 。
认识进程状态
Linux 中进程状态一般有:
R(运行状态):并不意外着真正的在运行(指正在被 CPU 调度);
S(休眠状态):进程在等待获取某种资源,此状态还被称为可中断休眠;
D(磁盘休眠状态):在这个状态的进程也是在休眠,但是不可被中断,因此又称过该状态为不可中断休眠;
T(暂停状态):可以通过发送 SIGSTOP 信号给进程来停止进程。这个被暂停的进程可以通过发送 SIGCONT 信号让进程继续运行。
X(死亡状态):这个状态只是一个返回状态,你不会在任务列表里看到这个状态;
Z(僵尸状态):当一个子进程没有被父进程“回收”,该进程就会处于僵尸状态;
下面为这些状态在 kernel 源代码中的定义:
如何查看进程状态
输入指令:
接下来我们就依次来看各种状态是什么模样吧~
R 状态
引例
当你在电脑上同时运行很多程序,例如你敲代码的时候,还听着某个软件播放的歌曲,或者在浏览器之间来回切换。请问此时这些所有的应用都在 CPU 运行吗?
答案是,并不是这样的。
在 CPU 进行工作的时候,会存在一个进程运行的队列。队列维护的内容是一个个 task_struct 结构体的指针(上一章中讲到了 task_struct 为进程描述符)。在该队列中维护的进程都处于 R 状态,且等着被 CPU 所调度。
如何观察
写下一段简单的代码:
在运行该程序之后,查看该进程的状态如图所示:
问题又来了,为什么在该程序执行时,并没有看到所谓的 R 状态呢?
答案是,由于 CPU 运算速度太快了,我们基本很难看到 R 状态。该进程死循环的在屏幕上打印 hello myprocess。我们都知道此时的屏幕是一种外设,而 CPU 的计算速度相比较外设的访问速度根本不在一个量级。所以,该进程死循环的在屏幕上打印内容,有 99.9%的时间都在访问外设,剩下的时间是 CPU 在做计算。在进程访问外设的时候,CPU 并不会傻傻的原地等待,而是转头却做别的事,当该进程访问外设成功后,CPU 再对它进行调度。
那么有什么办法等看到 R 状态呢?我们将上面的代码略作修改:
如上图所示,当我们不再访问外设,而是只不停地做重复的运算,此时 CPU 会一直被调度,就能看到 R 状态了。
S 状态与 D 状态
S 状态
S 状态称为休眠状态。一个进程好端端地为什么要休眠呢?难道是因为运行太久累到了吗?当然不是这样。休眠状态本质是一种阻塞。
阻塞:进程因为等待某种资源就绪而表现出的不推进的状态。
例如,当一个进程运行到一半,需要从磁盘上获取很大的一块数据,那么就要花费较久的时间。此时 OS 的处理方式是,让该进程继续等待它要的数据,但是要求你不能在等待资源的时候还占用着 CPU,于是该进程就被 OS 安排到某个地方进行等待,这时该进程就处于 S 状态。
如何观察
如上图所示,当进程等待用户从键盘上输入的数据时,它就处于睡眠状态。
D 状态
D 状态也是一种休眠状态,但是它又有个名字叫做磁盘休眠状态或者不可中断休眠。那么如何看待 S 状态与 D 状态的区别呢?
首先我们得清楚一般什么情况下进程会发生中断。当一个进程偷偷地地干一些坏事,此时用户想停止该进程,那就要向该进程发送一个中断信号,该进程就被“杀”掉了。
在一些情况下,不需要用户自己动手,OS 自己就能“杀”掉某些进程。例如,当内存资源非常紧张甚至危险到了整个系统的安全时,OS 就会“杀”掉一些不太重要的进程。
就比如某个进程因为在等待数据而进入休眠状态,此时被 OS 发现了,内存这么紧张你还在这睡懒觉?叉出去!好嘛,进程被叉出去了。此时数据被读到一半,结果当事人没了。这些数据只能被舍弃,不然谁找到刚刚那个进程投胎之后还能不能找到“我“。
这些被舍弃的数据若是一些无关紧要的数据也就罢了,丢就丢了。但若是什么机密文件那岂不是坏了大事了?所以,为了避免将某些不能中断的进程被 OS 误杀掉了,可让该进程处于不可被中断休眠状态即 D 状态。此时该进程休眠时终于不怕被打扰了,但是,各退一步,我换个地方睡,不然我怕你急眼。于是该进程休眠时,就在相对宽阔的磁盘当中去休眠了。
T 状态
T 状态称为停止状态,非常好理解,就是让某个进程暂停一下。例如在调试时,我们设置了几个断点。当进程在该断点处停下来时,该进程就处于暂停状态。
如何观察
方法一
当我们在第 9 行打上断点并运行后,程序停到了断点的位置。此时查看进程状态如下图所示:
注意:t 也是一种暂停状态。有时候也被叫做追踪状态。
方法二
我们可以通过给进程发送暂停的信号使进程进入暂停状态。编辑如下代码:
当程序开始运行后,此时向进程发送暂停的信号:
此外,我们还可以发送继续的信号让该进程继续执行:
注意
进程继续在运行了。但是我们发现有一个地方好像和之前不一样了,S 后面是不是一直有一个+号来着?我们也不知道+是干嘛的,只知道他现在好像消失了。
“+” 代表在前台运行,没有”+“表示在后台运行;
之前我们在终止一个程序时,习惯使用 Ctrl + c ,但是现在好像对于后台在运行的进程失效了,此时我们需要掌握一条新的指令来”杀掉“进程:
或者
X 状态与 Z 状态
X 状态为退出状态是一个瞬时状态不易观察,暂且认为它不重要;
Z 状态被称为僵尸状态。顾名思义,一个进程死了(退出了)但没有”收尸“,就成了”僵尸“。具体一点,当一个进程退出时如果它的父进程没有读取到该进程退出时返回的退出状态码,该进程就会变成僵尸进程。
概念有点多,先来理一理。首先什么是退出状态码?在一段 C 语言程序中,我们经常要在 main 函数结束时写一句代码——return 0; 。这个 0 就是退出状态码,但并不仅仅是 0,还可以是 1,2,3…
如何看到僵尸进程?
接下来我们就写一段代码看看僵尸进程:
当我们运行程序后,能看到程序正常的在运行;
此时当我们执行指令将子进程”杀“掉,子进程就会变成僵尸进程;
其中我们能看到一个英文单词——defunct 就是僵尸的意思。
僵尸进程的危害
维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存在 task_struct(即 PCB)中,换句话说,Z 状态一直不退出,PCB 一直都要维护。
一个父进程创建了很多子进程,就是不回收,就会造成内存资源的浪费。因为数据结构对象本身就要占用内存。
僵尸进程是有危害的,当然我们也可以避免它,这就需要在下一章节中提到了。
孤儿进程
当父进程活着,子进程提前挂掉,容易造成僵尸进程。那如果父进程提前挂掉,子进程又该何去何存呢?这就是我们接下来要讲的孤儿进程了。
如何看到孤儿进程
编辑如下代码:
运行该程序,我们使用 kill 命令”杀“掉父进程,此时再来查看进程信息:
如上图所示,子进程发生了两个变化。一是子进程的 PPID,二是子进程变为在后台运行了。
如何理解
当子进程的父进程挂掉之后,子进程会被 1 号进程领养。该进程也被称为孤儿进程。
那么为什么要进行领养呢?
答案是,找一个人为自己收尸。不然当哪一天自己突然挂掉,没人为自己收尸那么就会变成为祸人间的僵尸进程了。
版权声明: 本文为 InfoQ 作者【华为云开发者联盟】的原创文章。
原文链接:【http://xie.infoq.cn/article/060b8c2bbff064cc13018f9a3】。文章转载请联系作者。
评论