1.进程优先级
1.1.什么是进程优先级
- cpu资源分配的先后顺序,就是指进程的优先权(priority)。
- 优先权高的进程有优先执行权利。配置进程优先权对多任务环境的linux很有用,可以改善系统性能。
- 还可以把进程运行到指定的CPU上,这样一来,把不重要的进程安排到某个CPU,可以大大改善系统整 体性能。
1.2.为什么要进程优先级
- 资源是有限的,进程是多个的,注定了进程之间是竞争关系
- 操作系统必须保证大家是良心竞争,如果我们进程长时间得不到CPU资源,该进程的代码长时间无法得到推进——该进程的饥饿问题
如果长时间得不到CPU资源,那么这个在windows上表现为该程序长时间无响应
2.查看系统进程
在linux或者unix系统中,用ps –l命令则会类似输出以下几个内容:
默认情况下,ps -l只会显示当前账号的进程,看不到别的终端的进程
我们ps -al就能看到别的终端的进程了
干扰信息太多了 ,我们筛选一下自己创建的myproc进程
此命令会显示当前用户下所有进程的内容。
我们很容易注意到其中的几个重要信息,有下:
- UID : 代表执行者的身份
- PID : 代表这个进程的代号
- PPID :代表这个进程是由哪个进程发展衍生而来的,亦即父进程的代号
- PRI :代表这个进程可被执行的优先级,其值越小越早被执行
- NI :代表这个进程的nice值
2.1.UID
我们很明显的知道了,root的UID是0,zs_108的UID是1000
2.1.PRI和NI
- PRI也还是比较好理解的,不就是priority嘛,即进程的优先级,或者通俗点说就是程序被CPU执行的先后顺序,此值越小进程的优先级别越高。
- Linux的默认优先级为80。Linux的优先级是可以被修改的,范围在[60,99]。
- NI,就是我们所要说的nice值了,其表示进程可被执行的优先级的修正数值
- PRI值越小越快被执行,那么加入nice值后,将会使得PRI变为:PRI(new)=PRI(old)+nice
- 这样,当nice值为负值的时候,那么该程序将会优先级值将变小,即其优先级会变高,则其越快被执行
- 所以,调整进程优先级,在Linux下,就是调整进程nice值
- nice其取值范围是-20至19,一共40个级别
看完了上面的定义我们的问题就来了,在Linux中为什么调整优先级是受限制的呢?Linux为什么不能可以将[60,99]调整为[-∞,+∞]。
那是因为如果不加限制,如果恶意将自己的优先级调整的非常高,而给其余人的优先级调整的非常低(优先级较高的进程先享受CPU的资源),那些系统开启自启动的进程也就是正常系统进程很难再享受到CPU的资源,会变得卡顿。这样的情况叫做进程饥饿。
任何的分时操作系统在调度上都要保证较为公平的调度
2.3.调整优先级
更改优先级的方法有挺多的,nice和renice指令是不错的选择,大家可以去百度一下
我们这里讲用top指令来更改优先级
我们先开启两个账号
这个test的优先级是80
我们打开top
打开了之后,我们点击r——重新调整优先级
然后输入test的PID
按回车,接下来通过修改nice值来修改PRI
普通用户不能调优先级
我们换root账号来重复上面的步骤,完成了
NICE值变成了-20,这个是因为他的范围限制!!!!
PRI的也是60,也是因为它的范围限制
我们此时再去调整PRI,我们把nice值设置为10,我们发现NI变成了10,但是PRI变成了90
注意:pri(old)的优先级再每一次设置时都是80,而不是前一次的优先级!!!
2.4.优先级队列实现原理
我们所对应的优先级[60,99]在运行时会转换成[100,139]。
进程在进程优先级队列当中是从上往下,从左往右进行调度的,当runing
中的进程被调度完之后,通过指针交换来继续调度waiting
中的进程,以此循环,就构成了我们所看到的优先级队列。
3.几个小问题
我们先来回答几个问题??
3.1.为什么函数的返回值会被外部拿到呢?
这是因为我们CPU上有很多的寄存器,我们平时函数返回的时候会将返回数据,写入到寄存器中,外部再通过读取寄存器中的值来获取函数返回值。
return a -> mov eax a //返回值a会转化成mov指令,将变量a中的值保存在eax寄存器中
3.2.系统怎么知道我们的进程当前执行到哪行代码了呢
在我们计算机的CPU中有一个程序计数器PC指针,或者eip,这两个都是用来记录当前进程正在执行的下一行指令的地址。
程序计数器通常被存储在寄存器中,这样可以让CPU在读取指令时更快地访问。由于CPU是按照顺序执行指令的,因此程序计数器的主要功能就是告诉CPU下一个要执行的指令在哪里。
3.3.在CPU中寄存器扮演什么角色呢?
在我们CPU中有很多的寄存器例如,
- 通用寄存器:eax,ebx,ecx,edx等等。通用寄存器从字面意思来理解就是没有什么用的寄存器,只要你需要,我就可以来供你使用,保存一些数据了什么的。
- 栈帧寄存器:ebp,esp,eip等等。用来维护函数栈帧结构的寄存器。
- 状态寄存器status。是一个包含有关处理器状态信息的寄存器。它通常包含一些标志位,例如:溢出标志,进位标志,奇偶标志等等。
CPU中有大量的寄存器主要是为了提高效率,进程的高频数据会被放入寄存器中,寄存器中保存了进程的相关数据,以方便进行对数据的访问或者修改。
cpu寄存器中保存的进程的临时数据,也包含进程的上下文数据,进程上下文包括执行该进程有关的各种寄存器(例如通用寄存器、程序计数器PC、程序状态字寄存器PS等)的值。
3.4.为什么要保存进程的上下文数据呢?
所有的保存都是为了恢复,如果我们不保存进程的上下文数据,那么进程再被切换出去之后,再被切换回来的时候,CPU就不知道该从哪里开始运行,所以我们进程在被切换的时候会将自己的上下文保存好甚至带走,等到再次被调度的时候,首先做的第一件事就是恢复上下文,随后再接着执行代码。
3.5.5进程数据上下文保存在哪里呢?
一般情况下我们把进程的上下文是以结构体形式保存在进程的PCB数据结构(task_struct)里的。
struct reg_info
{int eax;int ebc;int eip;.......
}
4.补充知识
- 竞争性: 系统进程数目众多,而CPU资源只有少量,甚至1个,所以进程之间是具有竞争属性的。为了高效完成任务,更合理竞争相关资源,便具有了优先级
- 独立性: 多进程运行,需要独享各种资源,多进程运行期间互不干扰
- 并行: 多个进程在多个CPU下分别,同时进行运行,这称之为并行
- 并发: 多个进程在一个CPU下采用进程切换的方式,在一段时间之内,让多个进程都得以推进,称之为并发
5.进程的调度与切换
- 我们都知道在程序都被task_struct进行管理的,当进程需要运行时,就需要进行排队。
- 我们也知道CPU中有个时间片的东西来控制各个进程一次在CPU中最长占用时间。
- 当某些程序过大导致在规定的时间片内执行不完时,我们就需要切换到下一个队列中的程序。
- 那之前的程序应该怎么办?
CPU中存在大量的寄存器,我们在VS中调用堆栈可以看到,有一些:eds/ecs/fg/gs,eip,cr0-cr4,eax/ebx/ecx/edx,等待。这些寄存器可以帮助我们进行对这些代码数据进行记录保存,例如eip(也叫pc指针),这个寄存器可以记录我们的代码执行到了哪一部分。所以说进程在运行过程中要产生大量临时数据放在CPU的寄存器中!!!这些临时数据被我们保存在各个进程的PCB中。 后来恢复运行的时候我们寄存器只需从这里读取数据便可继续执行。
CPU内部的所有临时数据我们叫做进程硬件的上下文。保存我们的进程上下文叫做保护上下文。在首次调度时,我们只需要将代码的起始地址放到eip中,然后逐步进行,进行时生成的临时数据被我们放到寄存器中。而二次调度时,我们只需要将上下文数据恢复到寄存器中即可!
进程在被切换的时候的基本步骤如下:
- 保存上下文
- 恢复上下文
上图是早期进程切换源码 。
总结:所有的保存都是为了最终的恢复,所有的恢复都是为了在上一次保存的位置继续执行!!!
CPU内的寄存器只有一套,而寄存器内部保存的数据可以有多套。所以虽然寄存器数据放在了一个共享的CPU中,但是所有的数据其实都是被私有的!!
4.内核进程调度队列
上图是Linux2.6内核中进程队列的数据结构,之间关系也已经给大家画出来。在这里我们只看红框和蓝框对应的部分。
首先我们来看queue[140],真正的类型:task_struct* queue[40]。他其实是一个指针数组,里面存放的是task_struct指针,那为什么是140个呢?前0~99我们不用,因为0~99中我们存放的时实时操作,剩下的100~130一共40个刚好对应的是我们上文所提到的优先级的范围差值,正好在每一个数组中可以存放相同优先级的task_struct。这就好比一个C++中的哈希桶结构。
当我们执行进程时,我们就从优先级最高的开始依次往下执行。但是有些队列是为空的,我们需要依次进行扫描判断吗?这就要出现第二个数据int bitmap[5]。 一个int4个字节,32bit,那么这个数组就是32*5 = 160比特位。所以比特位的位置表示哪一个队列,比特位的内容表示这个队列是否为空!就是所谓的位图算法。
我们可以注意到蓝框与红框的内容是一样的,为了避免进程的饥饿问题,Linux操作系统就想出了以对策:
我们可以看到上图中有一个array结构体数组,他里面存放了蓝框与红框的内容,蓝框中的queue被称为活跃队列,红框中被称为过期队列。当活跃队列中的进程开始被cpu进行调度时,后来的进程就不能在放入到活跃队列中去,而是放到过期队列中。直到活跃队列中的进程全部执行完毕后,再将活跃队列与过期队列进行交换,交换时只需要改变指针变量的内容即可。