Linux 系统 - 进程信号
@TOC
零、前言
本章主要讲解学习 Linux 中的信号,从信号的产生到识别,再到处理的各个时期的详细学习
一、信号入门
1、生活角度的信号
示例:
你在网上买了很多件商品,再等待不同商品快递的到来。但即便快递没有到来,你也知道快递来临时,你该怎么处理快递。也就是你能“识别快递”
当快递员到了你楼下,你也收到快递到来的通知,但是你正在打游戏,需 5min 之后才能去取快递。那么在在这 5min 之内,你并没有下去去取快递,但是你是知道有快递到来了。也就是取快递的行为并不是一定要立即执行,可以理解成“在合适的时候去取”
在收到通知,再到你拿到快递期间,是有一个时间窗口的,在这段时间,你并没有拿到快递,但是你知道有一个快递已经来了。本质上是你“记住了有一个快递要去取”当你时间合适,顺利拿到快递之后,就要开始处理快递了
而处理快递一般方式有三种:1. 执行默认动作(幸福的打开快递,使用商品)2. 执行自定义动作(快递是零食,你要送给你你的女朋友)3. 忽略快递(快递拿上来之后,扔掉床头,继续开一把游戏)快递到来的整个过程,对你来讲是异步的,你不能准确断定快递员什么时候给你打电话
2、技术应用角度的信号
示例:
用户输入命令,在 Shell 下启动一个前台进程;用户按下 Ctrl-C,这个键盘输入产生一个硬件中断,被 OS 获取解释成信号,发送给目标前台进程,前台进程因为收到信号,进而引起进程退出
示图:
注意:
Ctrl-C 产生的信号只能发给前台进程。一个命令后面加个 &可以放到后台运行,这样 Shell 不必等待进程结束就可以接受新的命令,启动新的进程
Shell 可以同时运行一个前台进程和任意多个后台进程,只有前台进程才能接到像 Ctrl-C 这种控制键产生的信号
前台进程在运行过程中用户随时可能按下 Ctrl-C 而产生一个信号,也就是说该进程的用户空间代码执行到任何地方都有可能收到 SIGINT 信号而终止,所以信号相对于进程的控制流程来说是异步的
3、信号及其处理概念
信号的基本概念:
信号是进程之间事件异步通知的一种方式,属于软中断
用 kill -l 命令可以察看系统定义的信号列表
每个信号都有一个编号和一个宏定义名称,这些宏定义可以在 signal.h 中找到
编号 1-31 的信号是普通信号,在合适的时候进行处理,而编号 34-64 的信号是实时信号,需要进行立即处理
这些信号各自在什么条件下产生,默认的处理动作是什么,在 signal(7)中都有详细说明: man 7 signal
信号处理常见方式:
忽略此信号
执行该信号的默认处理动作
提供一个信号处理函数,要求内核在处理该信号时切换到用户态执行这个处理函数,这种方式称为捕捉(Catch)一个信号
二、信号产生
1、终端按键产生
SIGINT(ctrl+c)的默认处理动作是终止进程,SIGQUIT(ctrl+\)的默认处理动作是终止进程并且 Core Dump,这个键盘输入产生一个硬件中断,被 OS 获取解释成信号,发送给目标前台进程,前台进程因为收到信号,进而引起进程退出
Core Dump 的概念:
当一个进程要异常终止时,可以选择把进程的用户空间内存数据全部保存到磁盘上,文件名通常是 core+进程 id,这叫做 Core Dump
进程异常终止通常是因为有 Bug,比如非法内存访问导致段错误,事后可以用调试器检查 core 文件以查清错误原因,这叫做事后调试
一个进程允许产生多大的 core 文件取决于进程的 Resource Limit(这个信息保存 在 PCB 中),默认是不允许产生 core 文件的,因为 core 文件中可能包含用户密码等敏感信息不安全,且产生的 core 文件内容比较大
注:在开发调试阶段可以用 ulimit -c 1024 命令限制,允许产生 core 文件(允许 core 文件最大为 1024K)
示例:
示图:
注:使用 gdb 对当前可执行程序进行调试,然后直接使用
core-file core文件
命令加载 core 文件,即可判断出该程序在终止时的信号,并且定位错误代码
Core dump 标志位:
waitpid 函数的第二个参数 status 是一个输出型参数,用于获取子进程的退出状态。status 是一个整型变量,但 status 不能简单的当作整型来看待,status 的不同比特位所代表的信息不同
示图:
注意:
若进程是正常终止的,那么 status 的次低 8 位就表示进程的退出码
若进程是被信号所杀,那么 status 的低 7 位表示终止信号,而第 8 位比特位是 core dump 标志,即进程终止时是否进行了核心转储
2、kill 命令发信号
首先在后台执行死循环程序,然后用 kill 命令给它发信号
示例:
结果:
注意:
指定发送某种信号的 kill 命令可以有多种写法,上面的命令还可以写成 kill -SIGFPE 18425 或 kill -8 4568 , 8 是信号 SIGFPE 的编号
kill 命令是调用 kill 函数实现的,kill 函数可以给一个指定的进程发送指定的信号;raise 函数可以给当前进程发送指定的信号(自己给自己发信号) ;abort 函数使当前进程接收到信号而异常终止
函数原型:
3、软件条件产生信号
SIGPIPE 信号:
SIGPIPE 信号实际上就是一种由软件条件产生的信号,当进程在使用管道进行通信时,读端进程将读端关闭,而写端进程还在一直向管道写入数据,那么此时写端进程就会收到 SIGPIPE 信号进而被操作系统终止
示例:
结果:
alarm 函数和 SIGALRM 信号:
alarm 函数原型:
解释:
功能:让操作系统在 seconds 秒之后给当前进程发送 SIGALRM 信号,SIGALRM 信号的默认处理动作是终止进程
返回值:若调用 alarm 函数前,进程已经设置了闹钟,则返回上一个闹钟时间的剩余时间,并且本次闹钟的设置会覆盖上一次闹钟的设置;如果调用 alarm 函数前,进程没有设置闹钟,则返回值为 0
示例:某人要小睡一觉,设定闹钟为 30 分钟之后响,20 分钟后被人吵醒了,还想多睡一会儿,于是重新设定闹钟为 15 分钟之后响,“以前设定的闹钟时间还余下的时间”就是 10 分钟。如果 seconds 值为 0,表示取消以前设定的闹钟,函数的返回值仍然是以前设定的闹钟时间还余下的秒数
示例:
效果:
注:这个程序的作用是 1 秒钟之内不停地数数,1 秒钟到了就被 SIGALRM 信号终止
4、硬件异常产生信号
硬件异常被硬件以某种方式被硬件检测到并通知内核,然后内核向当前进程发送适当的信号
示例:当前进程执行了除以 0 的指令,CPU 的运算单元会产生异常,内核将这个异常解释 为 SIGFPE 信号发送给进程;当前进程访问了非法内存地址,MMU 会产生异常,内核将这个异常解释为 SIGSEGV 信号发送给进程
示例:子进程野指针错误
结果:
在 C/C++当中除零,内存越界等异常,在系统层面上,是被当成信号处理的
三、阻塞信号
1、信号其他相关常见概念
实际执行信号的处理动作称为信号递达(Delivery)
信号从产生到递达之间的状态,称为信号未决(Pending)
进程可以选择阻塞 (Block )某个信号
被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作
注:阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作
2、在内核中的表示
信号在内核中的表示示意图:
解释:
每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作
注:在 block 位图中,比特位的位置代表某一个信号,比特位的内容代表该信号是否被阻塞;在 pending 位图中,比特位的位置代表某一个信号,比特位的内容代表是否收到该信号;handler 表本质上是一个函数指针数组,数组的下标代表某一个信号,数组的内容代表该信号递达时的处理动作,处理动作包括默认、忽略以及自定义;block、pending 和 handler 这三张表的每一个位置是一一对应的
信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志
在上图,SIGHUP 信号未阻塞也未产生过,当它递达时执行默认处理动作;SIGINT 信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞;SIGQUIT 信号未产生过,即使产生 SIGQUIT 信号也将被阻塞,它的处理动作是用户自定义函数 sighandler
系统发送信号的本质:修改进程 PCB 中的 pending 位图
如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理
POSIX.1 允许系统递送该信号一次或多次,Linux 是这样实现的:常规信号在递达之前产生多次只计一次,信号数据存在丢失,而实时信号在递达之前产生多次可以依次放在一个队列里,信号数据不会丢失
3、sigset_t 信号集
每个信号只有一个 bit 的未决标志,非 0 即 1,不记录该信号产生了多少次,阻塞标志也是这样表示的
未决和阻塞标志可以用相同的数据类型 sigset_t 来存储,sigset_t 称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态
阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略
4、信号集操作函数
sigset_t 类型对于每种信号用一个 bit 表示“有效”或“无效”状态,至于这个类型内部如何存储这些 bit 则依赖于系统实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作 sigset_ t 变量,而不应该对它的内部数据做任何解释,比如用 printf 直接打印 sigset_t 变量是没有意义的
操作函数原型:
解释:
函数 sigemptyset:初始化 set 所指向的信号集,使其中所有信号的对应 bit 清零,表示该信号集不包含 任何有效信号
函数 sigfillset:初始化 set 所指向的信号集,使其中所有信号的对应 bit 置位,表示 该信号集的有效信号包括系统支持的所有信号
注意:
在使用 sigset_ t 类型的变量之前,一定要调用 sigemptyset 或 sigfillset 做初始化,使信号集处于确定的状态
初始化 sigset_t 变量之后就可以在调用 sigaddset 和 sigdelset 在该信号集中添加或删除某种有效信这四个函数都是成功返回 0,出错返回-1
sigismember 是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种信号,若包含则返回 1,不包含则返回 0,出错返回-1
sigprocmask:
调用函数 sigprocmask 可以读取或更改进程的信号屏蔽字(阻塞信号集)
解释:
如果 oset 是非空指针,则读取进程的当前信号屏蔽字通过 oset 参数传出
如果 set 是非空指针,则更改进程的信号屏蔽字,参数 how 指示如何更改
如果 oset 和 set 都是非空指针,则先将原来的信号 屏蔽字备份到 oset 里,然后根据 set 和 how 参数更改信号屏蔽字
how 参数的可选值:
注:如果调用 sigprocmask 解除了对当前若干个未决信号的阻塞,则 sigprocmask 返回前,至少将其中一个信号递达
sigpending:
使用示例:
效果:
注:程序运行时,每秒钟把各信号的未决状态打印一遍,由于我们阻塞了 SIGINT 信号,按 Ctrl-C 将会使 SIGINT 信号处于未决状态,按 Ctrl-\仍然可以终止程序,因为 SIGQUIT 信号没有阻塞
四、捕捉信号
1、内核中的信号捕捉
如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号
信号捕获处理过程: 用户程序设置了 SIGQUIT 信号的处理函数为 sighandler
示图:
解释:
当前正在执行 main 函数,这时发生中断或异常或者系统调用切换到内核态
在中断或者系统调用处理完毕后要返回用户态的 main 函数之前检查到有信号 SIGQUIT 递达
内核决定返回用户态后执行 sighandler 函数,sighandler 和 main 函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是两个独立的控制流程
sighandler 函数返回后自动执行特殊的系统调用 sigreturn 再次进入内核态
如果没有新的信号要递达,这次再返回用户态就是恢复 main 函数的上下文继续执行了
注:用户和内核态的转换是具有状态标识变量存在的,对于这样的状态转换是为了更好的管理和确保不同状态的各项的权限
2、信号捕捉 sigaction 函数
sigaction 函数原型 :
sigaction 结构体的定义:
解释:
sigaction 函数可以读取和修改与指定信号相关联的处理动作,调用成功则返回 0,出错则返回- 1;signo 是指定捕捉信号的编号
若 act 指针非空,则根据 act 修改该信号的处理动作;若 oact 指针非空,则通过 oact 传出该信号原来的处理动作;act 和 oact 指向 sigaction 结构体
将 sa_handler 赋值为常数 SIG_IGN 传给 sigaction 表示忽略信号,赋值为常数 SIG_DFL 表示执行系统默认动作;赋值为一个函数指针表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函数,该函数返回值为 void,可以带一个 int 参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号,这是一个回调函数,不是被 main 函数调用,而是被系统所调用
注意:
当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么它会被阻塞到当前处理结束为止
如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用 sa_mask 字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字
sa_flags 字段包含一些选项,本章的代码都把 sa_flags 设为 0,sa_sigaction 是实时信号的处理函数
示例:
结果:
3、可重入函数
示图:
解释:
main 函数调用 insert 函数向一个链表 head 中插入节点 node1,插入操作分为两步,刚做完第一步的时候,因为硬件中断使进程切换到内核,再次回用户态之前检查到有信号待处理,于是切换到 sighandler 函数,sighandler 也调用 insert 函数向同一个链表 head 中插入节点 node2,插入操作的两步都做完之后从 sighandler 返回内核态,再次回到用户态就从 main 函数调用的 insert 函数中继续 往下执行,先前做第一步之后被打断,现在继续做完第二步。结果是,main 函数和 sighandler 先后 向链表中插入两个节点,而最后只有一个节点真正插入链表中了
可重入函数定义:
像上例这样,insert 函数被不同的控制流程调用,有可能在第一次调用还没返回时就再次进入该函数,这称为重入
insert 函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数称为不可重入函数
如果一个函数只访问自己的局部变量或参数,则称为可重入函数(可以被多个执行流访问,并不会造成数据错乱)
如果一个函数符合以下条件之一则是不可重入的:
调用了 malloc 或 free,因为 malloc 也是用全局链表来管理堆的
调用了标准 I/O 库函数,标准 I/O 库的很多实现都以不可重入的方式使用全局数据结构
4、volatile 关键字
volatile 作用:
保持内存的可见性,告知编译器,被该关键字修饰的变量,不允许被优化,对该变量的任何操作,都必须在真实的内存中进行操作
示例:站在信号的角度重新理解 volatile
结果:
注意:
标准情况下,键入 CTRL-C ,2 号信号被捕捉,执行自定义动作,修改 flag=1 , while 条件不满足,退出循环,进程退出
优化情况下,键入 CTRL-C ,2 号信号被捕捉,执行自定义动作,修改 flag=1 ,但是 while 条件依旧满足,而此时 while 循环检查的 flag 并不是内存中最新的 flag(数据二异性的问题),while 检测的 flag 其实已经因为优化,被放在了 CPU 寄存器当中(储存的是修改之前的值)
5、SIGCHLD 信号
概念:
父进程可以阻塞等待子进程结束,也可以非阻塞地查询是否有子进程结束等待清理(轮询的方式):采用第一种方式,父进程阻塞了就不能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一 下,程序实现复杂
其实子进程在终止时会给父进程发 SIGCHLD 信号,该信号的默认处理动作是忽略,父进程可以自定义 SIGCHLD 信号的处理函数,这样父进程只需专心处理自己的工作,不必关心子进程了,子进程终止时会通知父进程,父进程在信号处理函数中调用 wait 清理子进程即可
示例:
效果:
由于 UNIX 的历史原因,要想不产生僵尸进程还有另外一种办法:
父进程调用 sigaction 将 SIGCHLD 的处理动作置为 SIG_IGN,这样 fork 出来的子进程在终止时会自动清理掉,不会产生僵尸进程,也不会通知父进程
注:系统默认的忽略动作和用户用 sigaction 函数自定义的忽略 通常是没有区别的,但这是一个特例。此方法对于 Linux 可用,但不保证在其它 UNIX 系统上都可用
示例:
效果:
版权声明: 本文为 InfoQ 作者【可口也可樂】的原创文章。
原文链接:【http://xie.infoq.cn/article/6a7ac7041f7305e0bc23e2116】。文章转载请联系作者。
评论