目录
1. 信号的概念搞定(输出结论,支撑我们的理解)
补充知识
2.信号的产生
补充知识
3.信号的保存
4.阻塞信号
1. 信号其他相关常见概念
2. 在内核中的表示
3. sigset_t
4. 信号集操作函数
sigprocmask
sigpending
5. 信号的处理
1.什么时候被处理的
补充内容 重谈地址空间 3
6.信号捕捉
1. 内核如何实现信号的捕捉
2. sigaction
知识补充 可重入函数
知识补充 volatile
SIGCHLD信号
1. 信号的概念搞定(输出结论,支撑我们的理解)
我们日常生活中遇到的信号:信号弹 上下课铃声 红绿灯 闹钟等等
a.我们怎么认识这些信号? 有人教->然后我们记住
什么叫认识? 我们需要识别信号并且知道信号的处理办法
b.即使现在没有信号产生 我也知道信号产生之后我干什么
c.信号产生了 我们可能并不立即处理这个信号,而是在合适的时候处理。因为我们可能在做更加重要的事情
所以信号产生--------时间窗口------信号处理 (信号的处理方式1.默认动作2.忽略3.自定义动作 ,也被称为信号的捕捉)
所以在这个时间窗口之内,我们必须记住信号的到来
上面所有的我和我们,在Linux下就是进程,因此进程
1.进程必须可以 识别+处理 信号-------即使信号没有产生,也要具备处理信号的能力------信号的处理能力属于进程内置功能的一部分
2.进程即使是没有收到信号,也知道哪些信号该如何处理
3.当进程真的收到了一个具体信号的时候,进程可能并不会立即处理这个信号,而是在合适的时候处理
4.信号产生到信号开始处理会有时间窗口。进程具有临时保存哪些信号已经发生了的能力
ctrl + c 为什么能杀掉我们的前台进程呢?------>键盘输入首先是被前台进程收到的
Linux中,依次登陆中,一个终端,一般会配上一个bash,每一个登录只允许一个进程是前台进程,但是可以允许多个进程是后台进程
ctrl+c本质是被进程解释成为收到了2号信号
1-31属于普通信号
34-64属于实时信号需要立即处理,本文暂且不作讨论
下面进行一个实验
1.处理信号时,默认,忽略,自定义 这三种行为都是并列的,一次只执行一种
2.signal 的方法只需要设置一次,往后就一直有效。
但是是在条件发生的时候才会生效,即收到了对应信号时
补充知识
我们操作系统是如何知道硬件上有数据输入呢?并不是轮换地去遍历,而是通过硬件中断的机制来进行处理的。
例如键盘,如果键盘上有数据,那么键盘会发送一个中断信号(假设为10),这个信号是电信号,由中断单元发送,中断单元连接到cpu众多针脚中的一个,同时让cpu中的某个寄存器中存下10。在发送时,在硬件上信号由0(放电)1(充电)这样的充放电来控制,在软件上我们只需要通过对应的类型转换即可转换成数字。
操作系统中有一个中断向量表(一个数组),里面不同下标中存的就是访问不同硬件的内置访问方法。
我们的信号系统和这个没有关系,不过却是在软件层面对硬件中断的一种模仿
2.信号的产生
1.键盘组合键:
ctrl + c
ctrl + \
2.kill 命令
kill -signo pid
3.系统调用
kill,给任何进程发任何信号
raise 给本进程发任何信号
abort 给本进程发6号信号,发完后再退出
4. 异常(硬件层面异常)
a.除0错误
简单来说,出现除0错误时,cpu里面的状态寄存器中的溢出标志位会改变。
cpu出现问题了,那么操作系统作为硬件的管理者,也理应管理进行处理,操作系统会给对应进程发信号。是否停止发信号取决于状态寄存器,也即进程的上下文,若是进程并未退出,那么进程的上下文也不会切换走,此时操作系统就会不断地向进程发信号。
这种异常虽然是在cpu中,但是其实只影响一个进程。如果某个问题进程被切换掉了,那么它的上下文不管是否出现异常,这个上下文也会被切换。
b.段错误
其实也类似,即虚拟到物理内存转化失败。cpu中也有对应的寄存器存储
实际上,MMU是集成在cpu中的,页表中的地址也是存在cpu中的,转化失败的地址也会存储在cpu中。
每种异常的默认处理方式都是退出。 异常的处理涉及得更多,其中也会包含信号的处理。
其实,操作系统让我们捕捉信号并不是让我们进行操作去解决这些异常,而是让我们异常出现得更明白,像我们可以保存日志再退出,等等。
我们在各种语言比如c++c语言,语言中也有自己的异常的概念,上层是怎么识别对应异常的呢?这时候我们就应该知道是底层的信号起了作用,不同的信号代表了不同的异常。
5.软件条件
异常只会由硬件产生吗?并不是
例如我们之前 学习到的管道,如果我们写端一直再写,而读端则被关闭。那么写端也会被直接关闭,并且操作系统会给进程发一个13号的SIGPIPE的信号
不过操作系统对于一些问题的处理也有区别,比如下面这种
(这里也可以是写)这里并不会直接报错,出现异常,而是以返回值的形式来告诉我们。
软件上不仅仅会出异常,也可以出一些特殊事件,比如:闹钟(不过闹钟也有他的类别,这里我们只介绍普通闹钟)
闹钟就是一段时间后向进程发一个信号,返回值是闹钟响的时候距离预定时间的相隔秒数,例如我设置闹钟5秒后响,但是闹钟第三秒就响了,那么返回值就是2.
下面是利用闹钟每隔五秒进行一个打印,闹钟设置后会直接返回,因此会不断执行while里面的代码
补充知识
core dump
在我们之前的学习中,我们知道进程有正常终止和被信号所杀两种,其中我们没讲到的是,如果进程被信号所杀,退出码中会有一位作为core dump标志。
不过默认云服务器中的core dump功能是被关闭的,这个稍后再讲。
我们可以如上方式提取。
正常状态下core dump功能被关闭,如下。
不过我们可以打开 (同时编译时要-g,debug模式)
打开之后我们进行实验
我们发现,在我们打开core dump功能之后,一旦进程出现异常,操作系统会将进程在内存中的运行信息给我们转存到进程当前目录(磁盘),形成core.pid文件。
我们要查看,进到gdb调试里面之后再输入相关内容即可。会直接复现问题之后直接定位到出错行,先运行,再core dump,事后调试
但是我们会发现core.pid文件的大小还是挺大的,由于大多数时候我们服务挂了要立刻重启,(后面才是基于日志等进行修正),若是某个服务出现了问题,一重启就立刻挂了,那么就会不断形成core.pid文件,对操作系统产生危害。
3.信号的保存
a.什么是信号的发送
比特位的内容是0还是1表明是否收到
比特位的位置 标识信号的编号
所谓的发信号,本质是操作系统去修改task_struct 的信号位图对应的比特位。
操作系统是进程的管理者,只有它才有资格修改task_struct的内部属性!
b为什么要保存信号
进程收到信号之后,可能不会立即处理这个信号。信号不会被处理,就会有一个时间窗口
4.阻塞信号
1. 信号其他相关常见概念
1.实际执行信号的处理动作称为信号递达(Delivery)
2.信号从产生到递达之间的状态,称为信号未决(Pending)。
3.进程可以选择阻塞 (Block )某个信号。
4.被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作.
5.注意,阻塞和忽略是不同的,只要信号被阻塞就不会递达,而忽略是在递达之后可选的一种处理动作。
2. 在内核中的表示
信号在内核中的表示示意图
1. 每个信号都有两个标志位分别表示阻塞(block)和未决(pending),还有一个函数指针表示处理动作。信号产生时,内核在进程控制块中设置该信号的未决标志,直到信号递达才清除该标志。在上图的例子中,SIGHUP信号未阻塞也未产生过,当它递达时执行默认处理动作。
2.SIGINT信号产生过,但正在被阻塞,所以暂时不能递达。虽然它的处理动作是忽略,但在没有解除阻塞之前不能忽略这个信号,因为进程仍有机会改变处理动作之后再解除阻塞。
3.SIGQUIT信号未产生过,一旦产生SIGQUIT信号将被阻塞,它的处理动作是用户自定义函数sighandler。如果在进程解除对某信号的阻塞之前这种信号产生过多次,将如何处理?POSIX.1允许系统递送该信号一次或多次。Linux是这样实现的:常规信号在递达之前产生多次只计一次,而实时信号在递达之前产生多次可以依次放在一个队列里。本章不讨论实时信号。
3. sigset_t
从上图来看,每个信号只有一个bit的未决标志,非0即1,不记录该信号产生了多少次,阻塞标志也是这样表示的。
因此,未决和阻塞标志可以用相同的数据类型sigset_t来存储,sigset_t称为信号集,这个类型可以表示每个信号的“有效”或“无效”状态,在阻塞信号集中“有效”和“无效”的含义是该信号是否被阻塞,而在未决信号集中“有效”和“无效”的含义是该信号是否处于未决状态。
下一节将详细介绍信号集的各种操作。 阻塞信号集也叫做当前进程的信号屏蔽字(Signal Mask),这里的“屏蔽”应该理解为阻塞而不是忽略。
sigset_t 定义的类型在外部可以视为一个位图,我们不需要关心它的内部是怎么样的,但是我们必须通过系统调用接口来进行操作,见4
4. 信号集操作函数
sigset_t类型对于每种信号用一个bit表示“有效”或“无效”状态,至于这个类型内部如何存储这些bit则依赖于系统实现,从使用者的角度是不必关心的,使用者只能调用以下函数来操作sigset_ t变量,而不应该对它的内部数据做任何解释,比如用printf直接打印sigset_t变量是没有意义的
#include <signal.h>
int sigemptyset(sigset_t *set);
int sigfillset(sigset_t *set);
int sigaddset (sigset_t *set, int signo);
int sigdelset(sigset_t *set, int signo);
int sigismember(const sigset_t *set, int signo);
函数sigemptyset初始化set所指向的信号集,使其中所有信号的对应bit清零,表示该信号集不包含 任何有效信号。
函数sigfillset初始化set所指向的信号集,使其中所有信号的对应bit置位,表示 该信号集的有效信号包括系统支持的所有信号。
注意,在使用sigset_ t类型的变量之前,一定要调 用sigemptyset或sigfillset做初始化,使信号集处于确定的状态。初始化sigset_t变量之后就可以在调用sigaddset和sigdelset在该信号集中添加或删除某种有效信号。
这四个函数都是成功返回0,出错返回-1。
sigismember是一个布尔函数,用于判断一个信号集的有效信号中是否包含某种 信号,若包含则返回1,不包含则返回0,出错返回-1。
sigprocmask
调用函数sigprocmask可以读取或更改进程的信号屏蔽字(阻塞信号集)。
#include <signal.h>
int sigprocmask(int how, const sigset_t *set, sigset_t *oset);
返回值:若成功则为0,若出错则为-1
如果oset是非空指针,则读取进程的当前信号屏蔽字通过oset参数传出。如果set是非空指针,则 更改进程的信号屏蔽字,参数how指示如何更改。
如果oset和set都是非空指针,则先将原来的信号 屏蔽字备份到oset里,然后根据set和how参数更改信号屏蔽字。假设当前的信号屏蔽字为mask,下表说明了how参数的可选值。
如果调用sigprocmask解除了对当前若干个未决信号的阻塞,则在sigprocmask返回前,至少将其中一个信号递达。
sigpending
#include <signal.h>
sigpending()
读取当前进程的未决信号集,通过set参数传出。调用成功则返回0,出错则返回-1。 下面用刚学的几个函数做个实验。程序如下:
里面的set参数是一个输出型参数
程序运行时,每秒钟把各信号的未决状态打印一遍,由于我们阻塞了SIGINT信号,按Ctrl-C将会 使SIGINT信号处于未决状态,
按Ctrl-\仍然可以终止程序,因为SIGQUIT信号没有阻塞。
5. 信号的处理
1.什么时候被处理的
当我们的进程从内核态返回到用户态的时候,进行信号的检测和处理。
调用系统调用时------操作系统是自动会做“身份”切换的,用户身份变成内核身份。或者反着来
int 80 就是一个从用户态陷入内核态的汇编语句
内核态:允许访问操作系统的代码和数据
用户态:只能访问用户自己的代码和数据
以下这张图可以简要介绍
当进行系统调用的时候进入内核态
进入内核态后先调用方法处理,然后进行信号的处理,如果是默认或者忽略,那么直接返回用户态,回到主函数中相应位置。
如果用户捕捉,那么虽然同样需要返回用户态,但是需要进入用户写的信号处理函数。
(关于为什么要返回用户态再执行信号处理函数,那是因为操作系统不相信用户,因此也不愿意执行用户写的代码)
信号处理函数返回时先要重新进入内核态,因为只有操作系统知道我们上回处理的代码是在主函数的哪个部分。
(系统调用并不只我们代码中主动调用的,像进程通过时间片不断轮换调度,切换等等操作都是需要进行系统调用的,那么进入内核态的机会就有很多)
补充内容 重谈地址空间 3
内核空间也有自己的内核级页表
对于用户页表,有几个进程就有几份用户级页表 -----因为进程具有独立性
对于内核页表,它只有一份
因此每一个进程看到的3-4GB的东西都是一样的,整个系统中,进程再怎么切换,3-4GB的空间的内容是不变的(里面是一些系统调用等等)
进程视角:我们调用系统中的方法,就是再我自己的地址空间中进行执行的
操作系统视角:因为任何一个时候都有进程执行,因为每个进程看到的内核空间都是一样的,那么只要我想执行操作系统的代码,就可以随时去执行
操作系统的本质: 基于时钟中断的一个死循环
计算机硬件中,有一个时钟芯片,每隔一个很短的时间向计算机发送时钟中断,然后操作系统收到中断后就去调度进程。这种模式可以理解成抽陀螺,抽一鞭子转一下。
内核态和用户态的切换还与cpu有关,cpu中有一个ecs寄存器,里面的低两位用于表明内核态和用户态用户态为11,内核态为00.
6.信号捕捉
1. 内核如何实现信号的捕捉
如果信号的处理动作是用户自定义函数,在信号递达时就调用这个函数,这称为捕捉信号。由于信号处理函数的代码是在用户空间的,处理过程比较复杂,举例如下: 用户程序注册了SIGQUIT信号的处理函数sighandler。 当前正在执行main函数,这时发生中断或异常切换到内核态。 在中断处理完毕后要返回用户态的main函数之前检查到有信号SIGQUIT递达。 内核决定返回用户态后不是恢复main函数的上下文继续执行,而是执行sighandler函 数,sighandler和main函数使用不同的堆栈空间,它们之间不存在调用和被调用的关系,是 两个独立的控制流程。 sighandler函数返
回后自动执行特殊的系统调用sigreturn再次进入内核态。 如果没有新的信号要递达,这次再返回用户态就是恢复main函数的上下文继续执行了。
2. sigaction
#include <signal.h>
int sigaction(int signo, const struct sigaction *act, struct sigaction *oact);
sigaction函数可以读取和修改与指定信号相关联的处理动作 。调用成功则返回0, 出错则返回 - 1。signo是指定信号的编号。若act指针非空,则根据act修改该信号的处理动作。若oact指针非 空,则通过oact传出该信号原来的处理动作。act和oact指向sigaction结构体
我们看一下这个 struct sigaction 结构体,里面另外三个成员我们先不看,只看第一个和第三个。第一个成员是一个函数指针,指向信号的捕捉方法。
将sa_handler赋值为常数SIG_IGN传给sigaction 表示忽略信号,赋值为常数SIG_DFL表示执行系统默认动作,赋值为一个函数指针表示用自定义函数捕捉信号,或者说向内核注册了一个信号处理函 数,该函数返回值为void,可以带一个int参数,通过参数可以得知当前信号的编号,这样就可以用同一个函数处理多种信号。显然,这也是一个回调函数,不是被main函数调用,而是被系统所调用。
当某个信号的处理函数被调用时,内核自动将当前信号加入进程的信号屏蔽字,当信号处理函数返回时自动恢复原来的信号屏蔽字,这样就保证了在处理某个信号时,如果这种信号再次产生,那么 它会被阻塞到当前处理结束为止。 如果在调用信号处理函数时,除了当前信号被自动屏蔽之外,还希望自动屏蔽另外一些信号,则用sa_mask字段说明这些需要额外屏蔽的信号,当信号处理函数返回时自动恢复原来的信号屏蔽字。 sa_flags字段包含一些选项,本章的代码都把sa_flags设为0,sa_sigaction是实时信号的处理函数。
我们的pending位图里面的值 从1->0 是在调用捕捉方法之前。
下面是一点代码示例
知识补充 可重入函数
main函数调用insert函数向一个链表head中插入节点node1,插入操作分为两步,刚做完第一步的 时候,因为硬件中断使进程切换到内核,再次回用户态之前检查到有信号待处理,于是切换 到sighandler函数,sighandler也调用insert函数向同一个链表head中插入节点node2,插入操作的 两步都做完之后从sighandler返回内核态,再次回到用户态就从main函数调用的insert函数中继续 往下执行,先前做第一步之后被打断,现在继续做完第二步。结果是,main函数和sighandler先后 向链表中插入两个节点,而最后只有一个节点真正插入链表中了。
像上例这样,insert函数被不同的控制流程调用,有可能在第一次调用还没返回时就再次进入该函数,这称为重入,insert函数访问一个全局链表,有可能因为重入而造成错乱,像这样的函数称为 不可重入函数,反之,如果一个函数只访问自己的局部变量或参数,则称为可重入(Reentrant) 函数。
如果一个函数符合以下条件之一则是不可重入的:
调用了malloc或free,因为malloc也是用全局链表来管理堆的。
调用了标准I/O库函数。标准I/O库的很多实现都以不可重入的方式使用全局数据结构。
知识补充 volatile
gcc 编译有自己的优化程度, -O1 到 -O3是从低到高的三种优化程度
-O0是不进行优化(gcc/g++默认不优化)
我们如图书写一段代码进行测试
在不进行优化的时候,我们ctrl+c可以使程序正常结束,但是如果进行了高等级的优化那么ctrl+c就无法使程序跳出while循环。
具体原因如下
我们进行了优化之后,内存仍然会开辟,但是编译器发现我们在main函数中并没有对flag进行修改(handler是另一个执行流),因此将flag的值放到寄存器之后,每次判断都从cpu中拿,不往内存里拿(这样子执行速度会更快,因此起到优化作用),因此即使我们ctrl + c后修改了全局中flag的值,在内存中改变了flag的值,但是并没有影响到cpu中的flag的值。这种情况称为内存不可见。
我们只需要在flag前添加volatile关键字即可
volatile关键字可以防止编译器过度优化,保持内存的可见性。
我们还可以联想到register关键字,这是一个可视化优化,表示变量如果能放到寄存器里就放到寄存器里(即把变量的内容放在寄存器里,但是仍然是需要开辟内存的)
SIGCHLD信号
进程一章讲过用wait和waitpid函数清理僵尸进程,父进程可以阻塞等待子进程结束,也可以非阻 塞地查询是否有子进程结束等待清理(也就是轮询的方式)。采用第一种方式,父进程阻塞了就不 能处理自己的工作了;采用第二种方式,父进程在处理自己的工作的同时还要记得时不时地轮询一 下,程序实现复杂。
其实,子进程在终止时会给父进程发SIGCHLD信号,该信号的默认处理动作是忽略,(即默认,忽略,捕捉,三种方式中的默认,但是处理的具体方法是忽略)父进程可以自 定义SIGCHLD信号的处理函数,这样父进程只需专心处理自己的工作,不必关心子进程了,子进程 终止时会通知父进程,父进程在信号处理函数中调用wait清理子进程即可。如果有很多个子进程一起退那么就采用while循环一直wait,如果一次只退出一半出现阻塞,那么就更改waitpid的第三个参数,把它改成WNOHANG非阻塞。
事实上,由于UNIX 的历史原因,要想不产生僵尸进程还有另外一种办法:父进程调 用sigaction将SIGCHLD的处理动作置为SIG_IGN,(即默认,忽略,捕捉中的忽略)这样fork出来的子进程在终止时会自动清理掉,不 会产生僵尸进程,也不会通知父进程。系统默认的忽略动作和用户用sigaction函数自定义的忽略 通常是没有区别的,但这是一个特例。此方法对于Linux可用,但不保证在其它UNIX系统上都可 用。请编写程序验证这样做不会产生僵尸进程。