您的位置:首页 > 文旅 > 美景 > [Linux]:进程(下)

[Linux]:进程(下)

2024/12/23 11:13:28 来源:https://blog.csdn.net/Bettysweetyaaa/article/details/142033368  浏览:    关键词:[Linux]:进程(下)

img

✨✨ 欢迎大家来到贝蒂大讲堂✨✨

🎈🎈养成好习惯,先赞后看哦~🎈🎈

所属专栏:Linux学习
贝蒂的主页:Betty’s blog

1. 进程终止

1.1 进程退出的场景

进程退出只有以下三种情况:

  1. 代码运行完毕,结果正确。
  2. 代码运行完毕,结果不正确。
  3. 代码异常终止(进程崩溃)。

1.2 进程退出码

在编程中,我们通常认为main函数是代码的入口,但实际上它只是用户级别代码的入口。main函数是被其他函数间接调用的,例如在VS2013中,main函数由__tmainCRTStartup函数调用,而__tmainCRTStartup函数又是通过加载器被操作系统调用。所以,main函数是间接性被操作系统所调用。

由于main函数是这样被调用的,当main函数调用结束后,应该给操作系统返回相应的退出信息。这个退出信息以退出码的形式作为main函数的返回值返回。一般情况下,我们以0表示代码成功执行完毕,以非0表示代码执行过程中出现错误。这就是为什么我们常在main函数的最后返回0

比如我们执行以下代码:

#include<stdio.h>
int main()
{printf("hello betty!\n");return 0;
}

我们可以通过指令echo $?查看最近一次进程的退出码。

进程正常退出返回0,如果进程不是正常退出就会返回其对应的退出码,在C语言中我们可以通过strerror函数打印出对应的错误信息。

#include<stdio.h>
#include<string.h>
int main()
{for(int i=0;i<150;i++){printf("[%d]->%s\n",i,strerror(i));}return 0;
}

需要注意的是: 退出码都有对应的字符串含义,帮助用户确认执行失败的原因,而这些退出码具体代表什么含义是人为规定的,不同环境下相同的退出码的字符串含义可能不同。

1.3 exit与_exit函数

首先我们来介绍一下exit函数,其可以在代码中的任何地方退出进程,并且exit函数在退出进程前会做一系列工作:

  1. 执行用户通过atexiton_exit定义的清理函数。
  2. 关闭所有打开的流,所有的缓存数据均被写入。
  3. 调用_exit函数终止进程。

比如说以下这段代码:

#include<stdio.h>
#include<stdlib.h>
int main()
{printf("hello betty!");exit(1);return 0;
}

如果我们使用的是_exit函数,那么进程就会直接退出,并不会做任何处理。

#include<stdio.h>
#include<unistd.h>
int main()
{printf("hello betty!");_exit(1);return 0;
}

最后我们来谈谈returnexit_exit之间的区别与联系。

首先只有在main函数当中的return才能起到退出进程的作用,子函数当中return不能退出进程,而exit函数和_exit函数在代码中的任何地方使用都可以起到退出进程的作用。

使用exit函数退出进程前,exit函数会执行用户定义的清理函数、冲刷缓冲,关闭流等操作,然后再终止进程,而_exit函数会直接终止进程,不会做任何收尾工作。

画板

其中执行return num等同于执行exit(num),因为调用main函数运行结束后,会将main函数的返回值当做exit的参数来调用exit函数。

2. 进程等待

为了解决僵尸进程,获取子进程的退出信息我们需要使用进程等待。其中进程等待有两个关键的函数waitwaitpid

2.1 status参数

其中这两个关于进程等待的函数都有一个共同的参数status,如果对status参数传入NULL,表示不关心子进程的退出状态信息。否则,操作系统会通过该参数,将子进程的退出信息反馈给父进程。

*status虽然是一个整型变量,但*status不能简单的当作整型来看待,因为status的不同比特位所代表的信息不同,一般我们只考虑低的16个比特位。

*status的低16比特位当中,高8位表示进程的退出状态,即退出码。进程若是被信号所杀,则低7位表示终止信号,而第8位比特位是core dump标志。

画板

一般我们可以通过相关的位运算得到进程的退出码与退出信号。

exitCode = (status >> 8) & 0xFF; //退出码 11111111
exitSignal = status & 0x7F;      //退出信号 01111111

为了降低用户的使用成本,操作系统也为我们提供了两个宏表示对应的退出码与退出信号。

  • WIFEXITED(status):用于查看进程是否是正常退出,本质是检查是否收到信号。
  • WEXITSTATUS(status):用于获取进程的退出码。

2.2 wait函数

我们首先来介绍一下wait函数的使用的方法:

  • 原型:pid_t wait(int* status);
  • 参数:输出型参数,获取子进程的退出状态,不关心可设置为NULL
  • 返回值:等待成功返回被等待进程的pid,等待失败返回-1。

比如下面这段代码,我们用父进程一直等待子进程,然后获取其退出信息。

#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<sys/wait.h>
#include<sys/types.h>
int main()
{pid_t id = fork();//创建子进程if(id==0){//chlldint count=10;while(count--){printf("I am child:PID:%d,PPID:%d\n",getpid(),getppid());sleep(1);}exit(0);}//fatherint status=0;pid_t ret=wait(&status);//如果等待成功if(ret>0){printf("wait child success\n");if(WIFEXITED(status)){//退出正常printf("exit code:%d\n",WEXITSTATUS(status));}else{printf("exit signal:%d\n",status&0x7f);}}sleep(10);return 0;
}

子进程正常退出,父进程成功获取退出信息,子进程就不会形成僵尸进程。

如果我们通过指令杀死进程,父进程同样能等待成功并返回对应的信号。

2.3 waitpid函数

同样我们再来介绍waitpid函数。

  • 原型:pid_t waitpid(pid_t pid, int* status, int options);
  • 返回值:等待成功返回被等待进程的pid。如果设置了选项WNOHANG,而调用中waitpid发现没有已退出的子进程,则返回0。如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在。
  • 参数:pid:待等待子进程的pid,若设置为-1,则等待任意子进程。status:输出型参数,获取子进程的退出状态,不关心可设置为NULLoptions:当设置为WNOHANG时,若等待的子进程没有结束,则waitpid函数直接返回0,不予以等待。若正常结束,则返回该子进程的pid

例如,创建子进程后,父进程可使用waitpid函数一直等待子进程(此时将waitpid的第三个参数设置为0),直到子进程退出后读取子进程的退出信息。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>
#include <sys/types.h>
int main()
{pid_t id = fork();if (id == 0){//child          int count = 10;while (count--){printf("I am child...PID:%d, PPID:%d\n", getpid(), getppid());sleep(1);}exit(0);}//father           int status = 0;pid_t ret = waitpid(id, &status, 0);if (ret >= 0){//wait success                    printf("wait child success...\n");if (WIFEXITED(status)){//exit normal                                 printf("exit code:%d\n", WEXITSTATUS(status));}else{//signal killed                              printf("eixt siganl %d\n", status & 0x7F);}}sleep(10);return 0;
}

并且我们还可以使用创建等待多进程的方式。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
int main()
{pid_t ids[10]={0};for (int i = 0; i < 10; i++){pid_t id = fork();if (id == 0){//childprintf("child process created successfully...PID:%d\n", getpid());sleep(3);exit(i); //将子进程的退出码设置为该子进程PID在数组ids中的下标}//fatherids[i] = id;}for (int i = 0; i < 10; i++){int status = 0;pid_t ret = waitpid(ids[i], &status, 0);if (ret >= 0){//wait child successprintf("wait child success..PID:%d\n", ids[i]);if (WIFEXITED(status)){//exit normalprintf("exit code:%d\n", WEXITSTATUS(status));}else{//signal killedprintf("exit signal %d\n", status & 0x7F);}}}return 0;
}

2.4 非阻塞轮询

在传统的父子进程关系中,当子进程未退出时,父进程通常处于阻塞等待状态,在此期间父进程不能进行其他操作。

然而,我们可以采用非阻塞等待的方式。具体做法是在调用waitpid函数时,向第三个参数options传入WNOHANG。这样,如果等待的子进程没有结束,waitpid函数将直接返回 0,父进程不进行等待,可以去做自己的事情。而当等待的子进程正常结束时,waitpid函数会返回该子进程的pid,此时父进程可以读取子进程的退出信息。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
int main()
{pid_t id=fork();//创建子进程if(id==0){//childint count=3;while(count--){printf("child do something\n");sleep(3);}exit(0);}//fatherwhile(1){int status=0;pid_t ret=waitpid(id,&status,WNOHANG);if(ret>0){printf("wait success\n");printf("exit code:%d\n",WEXITSTATUS(status));break;}else if(ret==0){printf("father do other things\n");sleep(1);}else{//wait errorbreak;}}return 0;
}

3. 进程替换

3.1 进程替换的概念

我们前面知道,父子进程是共享代码与数据的,如果修改子进程的数据就会发生写实拷贝。而今天我们需要修改子进程的代码,则需要进行进程替换

当进程替换时,该进程的用户空间代码和数据完全被新程序替换,并从新程序的启动例程开始执行。

画板

如果父子进程共享数据与代码,当对子进程进行进程替换时就会发生写实拷贝,所以对子进程就行进程替换并不会影响父进程。

3.2 进程替换函数

进程替换可以使用一下六个函数:

这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回,如果调用出错则返回-1。

首先我们要介绍的是execl函数:

  • 原型:int execl(const char *path, const char *arg, …)
  • 参数:path是要执行程序的路径,arg是可变参数列表,表示你要如何执行这个程序, 注意以NULL为参数传递的结尾。
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/wait.h>
#include <sys/types.h>int main() 
{pid_t id = fork();if (id < 0) {perror("fork failed");return 1;} else if (id == 0) {// childif (execl("/usr/bin/ls","ls","-l","-a", NULL) == -1) {perror("execl failed");exit(-1);}} else {// fatherint status;pid_t ret = waitpid(id, &status, 0);if (ret < 0) {perror("waitpid failed");return 1;}if (WIFEXITED(status)) {printf("wait success\n");printf("exit code:%d\n", WEXITSTATUS(status));}}return 0;
}

并且我们也可能通过该接口,调用其他语言的脚本,比如我们调用一个python脚本。

execl("/usr/bin/python3","python","testp.py", NULL)

接下来我们将学习execlp接口:

  • 原型:int execlp(const char *file, const char *arg, …);
  • 参数:file是要执行程序的名称,arg是可变参数列表,表示你要如何执行这个程序, 注意以NULL为参数传递的结尾。
execlp("ls", "ls", "-a", "-l", NULL);//执行ls -a -l

继续学习execle接口:

  • 原型:int execle(const char *path, const char *arg, …, char *const envp[]);
  • 参数:path是要执行程序的路径,arg是可变参数列表,表示你要如何执行这个程序, 注意以NULL为参数传递的结尾,envp是你自己设置的环境变量。

例如,你设置了MYVAL环境变量,在mycmd程序内部就可以使用该环境变量。

char* myenvp[] = { "MYVAL=2021", NULL };
execle("./mycmd", "mycmd", NULL, myenvp);//执行./mycmd

继续学习execv接口:

  • 原型:int execv(const char *path, char *const argv[]);
  • 参数:path是要执行程序的路径,argv是一个指针数组,数组当中的内容表示你要如何执行这个程序,数组以NULL结尾。
char* myargv[] = { "ls", "-a", "-i", "-l", NULL };
execv("/usr/bin/ls", myargv);//执行ls -a -i -l

剩余接口我们就不在介绍了,因为每个接口的参数都类似,如果学习完上面接口,剩余接口的使用也是零成本。

最后为了方便记忆,我们将这些接口归类形成如下表格:

替换函数接口后后缀含义
l(list)参数采用列表方式
v(vector)参数采用数组方式
p(path)自动搜索环境变PATH,进行程序查找
e(env)自己维护环境变量,或者说自定义环境变量,可以传入自己设置的环境变量
函数名参数格式是否带路径是否使用当前环境变量
execl列表
execlp列表
execle列表否,需自己组装环境变量
execv数组
execvp数组
execve数组否,需自己组装环境变量

事实上,在系统调用中,只有execve才是真正的系统调用,其他五个函数(如execlexecleexeclpexecvexecvp)都是对execve函数的封装,目的是为了满足不同用户的需求。这也导致了在man手册中,execve位于第 2 节,而其他五个函数在第 3 节。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com