📌 个人主页: 孙同学_
🔧 文章专栏:Liunx
💡 关注我,分享经验,助你少走弯路!
文章目录
- 1. 前文铺垫
- 理解内核链表
- 2. 进程状态
- 2.1 进程状态查看
- 2.2 僵尸进程
- 2.3 僵尸进程危害
- 2.4 孤儿进程
- 3. 进程优先级
- 3.1 概念
- 3.2 查看系统进程
- 3.3 查看进程优先级的命令
- 3.4 补充概念-竞争、独立、并行、并发
- 4. 进程切换
- 5.Linux2.6内核进程O(1)调度队列
1. 前文铺垫
进程状态是task_struct
内的一个整数;进行:进程在调度队列中,进程的状态都是running
,阻塞:等待某种设备或者资源就绪。进程是一个队列,设备也是一个队列,当我们读磁盘,读网卡的时候,如果对应设备未就绪那么进程就要阻塞等待了。进程状态变化的表现之一就是要在不同的队列中进行流动,本质都是数据结构的增删查改!
理解内核链表
如果一个类里面有多个next
,prve
,那么就可以把任何一个task_struct
即属于运行队列,又属于全局链表,还可以把它放到二叉树中等。
2. 进程状态
一个进程可以有几个状态(在Linux内核里,进程有时候也叫做任务)。
- 下面的状态在kernel源代码里定义:
/*
*The task state array is a strange "bitmap" of
*reasons to sleep. Thus "running" is zero, and
*you can test for combinations of others with
*simple bit tests.
*/
static const char *const task_state_array[] = {"R (running)", /*0 */"S (sleeping)", /*1 */"D (disk sleep)", /*2 */"T (stopped)", /*4 */"t (tracing stop)", /*8 */"X (dead)", /*16 */"Z (zombie)", /*32 */
};
- R 运行或可运行 (Running 或 Runnable)
- 状态描述: 进程正在CPU上执行,或在运行队列中等待调度。
- 触发场景: 进程处于活动状态,正在执行或准备执行。
- S 可中断睡眠(Interruptible Sleep)
- 状态描述: 进程在等待事件完成(如
I/O
操作、信号),可被信号中断。- 触发场景: 例如调用
sleep()
、read()
等阻塞操作时。
- D 不可中断睡眠(Uninterruptible Sleep)
- 状态描述: 进程等待不可中断的操作(如硬件
I/O
),不响应信号。- 触发场景: 常见于磁盘
I/O
或某些内核操作,需等待操作完成。
- T 停止(Stopped)
- 状态描述: 进程被信号(如
SIGSTOP
、SIGTSTP
)暂停,需SIGCONT
恢复。- 触发场景: 手动暂停进程(如按
Ctrl+Z
)或调试时。
- Z 僵尸(Zombie)
- 状态描述: 进程已终止,但父进程未调用
wait()
回收资源。- 触发场景: 父进程未正确处理子进程退出,导致残留进程描述符。
- t 追踪状态(Tracing Stop)
- 状态描述: 进程被调试器(如
gdb
)跟踪时暂停,属于停止状态的一种。- 触发场景: 调试器设置断点或单步执行时。
- X 死亡(Dead)
- 状态描述: 子进程结束之后,父进程获取子进程信息之前。
- 触发场景: 父进程已回收子进程状态,短暂存在后消失。
2.1 进程状态查看
命令: ps aux / ps axj
a: 用于显示所有用户的进程,包括其他用户的进程(需要适当的权限)。默认情况下,ps 只显示当前用户的进程。
例如:ps a
x: 用于显示没有控制终端的进程。这些进程通常是后台运行的守护进程(daemon)。
例如:ps x
通常,ax
选项一起使用,以显示所有用户的所有进程,无论它们是否有控制终端。
例如:ps ax
j: 用于显示与作业控制相关的信息,包括进程组
ID(PGID)
、会话ID(SID)
、父进程ID(PPID)
,以及作业号(如果有的话)。
例如:ps j
这对于理解进程如何分组和作业控制很有帮助。
u : 用于以用户为中心的格式显示进程信息。它提供了每个进程的详细信息,如用户、CPU使用率、内存使用率、虚拟内存大小、驻留内存大小、控制终端、进程状态、启动时间、CPU时间和命令行。
例如:ps u
通常,u 选项与 aux 一起使用,以显示所有用户的详细进程信息。
例如:ps aux
2.2 僵尸进程
- 僵死状态
(Zombies)
是一个比较特殊的状态。当进程退出并且父进程(使用wait()系统调用)没有读取到子进程退出的返回代码时就会产生僵死(尸)进程。 - 僵死进程会以终止状态保持在进程表中,并且会一直在等待父进程读取退出状态代码。
- 只要子进程退出,父进程还在运行,但父进程没有读取子进程状态,子进程进入Z状态。
2.3 僵尸进程危害
- 进程的退出状态必须被维持下去,因为他要告诉关心它的进程(父进程),你交给我的任务,我
办的怎么样了。可父进程如果一直不读取,那子进程就一直处于Z
状态?是的! - 维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存在
task_struct(PCB)
中,换句话说,Z
状态⼀直不退出,PCB
一直都要维护?是的! - 那一个父进程创建了很多子进程,就是不回收,是不是就会造成内存资源的浪费?是的!因为数据结构对象本身就要占用内存,C语言中定义一个结构体变量(对象),是要在内存的某个位置进行开辟空间,那就会存在内存泄漏?是的!
如何避免呢?我们后期讲。
2.4 孤儿进程
- 我们先来创建一段代码
- 代码运行后,子进程一直运行,父进程运行
5
秒后退出
- 这个
1
号进程是谁呢?top
一下,我们可以看到它是systemd
- 我们继续查一下这个
systemd
- 为什么子进程会被
1(systemd)
号进程领养呢?如果不领养会出现什么问题呢?
答案是如果不被领养,那么这个子进程就进入僵尸进程,有可能会造成内存泄漏 - 父进程为什么不会变成孤儿进程或者僵尸进程呢?
答案是父进程也有自己的父进程,父进程的父进程就是bash
- 一旦进程变成孤儿进程,它就会被
1
号进程领养,变成后台进程,这时候Ctrl c
就杀不掉它了,我们只能使用kill
来杀死。
3. 进程优先级
3.1 概念
cpu
资源分配的先后顺序,就是指进程的优先级(priority)。- 目标资源稀缺,导致要通过优先级确认谁先谁后的问题。
- 优先权高的进程有优先执行权利。配置进程优先级对多任务环境的
linux
很有用,可以改善系统性能。 - 还可以把进程运行到指定的
CPU
上,这样一来,把不重要的进程安排到某个CPU
,可以大大改善系统整体性能。
- 优先级 vs 权限:优先级是能得到资源,先后的问题,权限是能否得到资源的问题
✏️优先级其实也是一种数字,是task_struct
中的一种属性,数字值越低,优先级越高 ,基于时间片的分时操作系统,优先级未来可能变化,但变化的幅度不能太大
3.2 查看系统进程
- 命令
ps -al
,其中a
表示所有,l
表示详细信息。 - 我们上上面代码中的父进程不再退出,父子进程一直运行,再运行代码
在linux
系统中,每个用户都有一个UID
,linux
中识别用户就是用UID
识别的。
UID
:代表执行者的身份PID
:代表这个进程的代号PPID
:代表这个进程是由哪个进程发展衍生出来的,亦即父进程的代号PRI
:代表这个进程可被执行的优先级,其值越小越早被执行。进程优先级默认:80
NI
:代表这个进程优先级的修正数据,nice
值
✏️进程真实的优先级 = PRI(默认) + NI
✏️PRI(new) = PRI(old) + nice- 所以,调整进程优先级,在
Linux
下,就是调整进程nice
值 nice
其取值范围是-20
至19
,一共40
个级别。linux
进程优先级范围[60,99]
- 查
UID
,命令ls -ln
sp
用户对应的UID
就是1001
,文件创建的时候会把这个UID
保存起来表明这个文件是谁创建的,进程创建的时候也会把UID
保存起来表明进程是谁创建的。
📌 所以当我们访问一个文件时,系统怎么识别出我们是拥有者,所属组,或者other
呢,我们访问文件时本质就是进程在访问文件,进程怎么知道我们是谁呢?答案是是谁启动的这个进程,进程就知道这个人的UID
,这个文件是谁创建的这个文件的UID
就有了,所以一个进程将来拿着它的UID
和文件的UID
做对比,相等了就是拥有者,不相等查下一个,两个都不相等就是other
。
✏️linux
系统中,访问任何资源都是进程访问,进程就代表用户。
3.3 查看进程优先级的命令
用top
命令更改已存在进程的nice
:
-
top
-
进入
top
后按“r”
‒>输入进程PID
‒>输入nice
值 -
其他调整优先级的命令:
nice
,renice
-
linux
调整优先级的系统调用
3.4 补充概念-竞争、独立、并行、并发
- 竞争性: 系统进程数目众多,而CPU资源只有少量,甚至1个,所以进程之间是具有竞争属性的。为了高效完成任务,更合理竞争相关资源,便具有了优先级
- 独立性: 多进程运行,需要独享各种资源,多进程运行期间互不干扰
- 并行: 多个进程在多个CPU下分别,同时进行运行,这称之为并行
- 并发: 多个进程在⼀个CPU下采用进程切换的方式,在一段时间之内,让多个进程都得以推进,称之为并发
4. 进程切换
先谈两个问题:
- 死循环进程是如何运行的
我们平时在vs
中写一个while(1)
的死循环,一旦跑起来我们就会发现系统会变卡了,但是不会卡死。
a.一旦一个进程占有CPU,会把自己的代码跑完吗?不会!(除非这个代码很短)每个进程系统都会为它分配一个叫做时间片的东西。所以每一个进程拥有CPU资源都不是永久性的,而是临时性的。
b.死循环进程不会打死进程,因为死循环进程不会一直占用CPU! - cpu,寄存器
cpu
执行一个进程的时候就和PCB的关系不大了,cpu
重点是访问的是进程的代码和数据,所以cpu
会访问当前进程的代码和数据,为了能够处理一条一条的代码和数据,所以cpu
中会存在很多的寄存器,每个寄存器在cpu
内部都有着临时保存数据的任务,所以当进程再跑时,寄存器就会被填上临时值,有的是计算结果,浮点数计算有没有错误等。
结论: a.寄存器就是cpu
内部的临时空间 b. 寄存器 != 寄存器里面的数据
进程如何切换?
CPU
上下文切换:其实际含义是任务切换,或者CPU
寄存器切换。当多任务内核决定运行另外的任务时,它保存正在运行任务的当前状态,也就是CPU
寄存器中的全部内容。这些内容被保存在任务自己的堆栈中,入栈工作完成后就把下一个将要运行的任务的当前状况从该任务的栈中重新装入CPU
寄存器,并开始下一个任务的运行,这一过程就是context switch
。
进程切换最核心的就是保存和恢复当前进程的硬件上下文数据,即cpu
内寄存器的内容。
- 保存在哪里?
保存到进程的task_struct
里面 - 如何区分新的进程和已经调度过的进程?
在task_struct
中增加一个标记位。
5.Linux2.6内核进程O(1)调度队列
- 一个CPU拥有一个
runqueue
- 如果有多个CPU就要考虑进程个数的负载均衡问题
- 优先级
- 普通优先级:100〜139(我们都是普通的优先级,想想nice值的取值范围,可与之对应!)
- 实时优先级:0〜99(不关心)
- 活动队列
- 时间片还没有结束的所有进程都按照优先级放在该队列
nr_active
:总共有多少个运行状态的进程queue[140]
:一个元素就是一个进程队列,相同优先级的进程按照FIFO
规则进行排队调度,所以,数组下标就是优先级!- 从该结构中,选择一个最合适的进程,过程是怎么的呢?
a. 从0
下标开始遍历queue[140]
b. 找到第一个非空队列,该队列必定为优先级最高的队列
c. 拿到选中队列的第一个进程,开始运行,调度完成!
d. 遍历queue[140]
时间复杂度是常数!但还是太低效了! bitmap[5]
:一共140个优先级,一共140个进程队列,为了提高查找非空队列的效率,就可以用5*32
个比特位表示队列是否为空,这样,便可以大 大提高查找效率。
- 过期队列
- 过期队列和活动队列结构一模一样
- 过期队列上放置的进程,都是时间片耗尽的进程
- 当活动队列上的进程都被处理完毕之后,对过期队列的进程进行时间片重新计算
- active指针和expired指针
active
指针永远指向活动队列expired
指针永远指向过期队列- 活动队列上的进程会越来越少,过期队列上的进程会越来越多,因为进程时间片到期时一直都存在的。
- 在合适的时候,只要能够交换
active
指针和expired
指针的内容,就相当于有具有了一批新的活动进程!
linux
真是算法调度:O(1)调度算法
再次理解nice
值:nice
值是为了保证老进程的优先级不被强制改变,原本进程的优先级不改变,加上一个nice
值,当本次调度完重新放入过期队列时,更新优先级,链入到指定位置。
👍 如果对你有帮助,欢迎:
- 点赞 ⭐️
- 收藏 📌
- 关注 🔔