1.了解浏览器的进程模型
1.什么是进程?
程序运行需要有它自己专属的内存空间,可以把这块内存空间简单的理解为进程
每个应用至少有一个进程,进程之间相互独立,即使要通信,也需要双方同意。
2.什么是线程?
有了进程后,就可以运行程序的代码了。
我们可以理解为操作程序的'人'就是线程。
一个进程至少有一个线程,所以在进程开启后会自动创建一个线程来运行代码,该线程称之为主线程。
如果程序需要同时执行多块代码,主线程就会启动更多的线程来执行代码,所以一个进程中可以包含多个线程。
3.浏览器的进程与线程
浏览器是一个多进程多线程的应用程序
浏览器内部工作极其复杂。
为了避免相互影响,为了减少连环崩溃的几率,当启动浏览器后,它会自动启动多个进程。
我们可以在浏览器的任务管理器中查看当前的所有进程
其中,最主要的进程有:
- 浏览器进程
主要负责界面显示、用户交互、子进程管理等。浏览器进程内部会启动多个线程处理不同的任务。
- 网络进程
负责加载网络资源。网络进程内部会启动多个线程来处理不同的网络任务。
- 渲染进程(本文重点讲解的进程)
渲染进程启动后,会开启一个渲染主线程,主线程负责执行 HTML、CSS、JS 代码。
默认情况下,浏览器会为每个标签页开启一个新的渲染进程,以保证不同的标签页之间不相互影响。
将来该默认模式可能会有所改变,有兴趣的同学可参见chrome官方说明文档
2.理解渲染进程
1.渲染进程的工作
渲染主线程是浏览器中最繁忙的线程,需要它处理的任务包括但不限于:
- 解析 HTML
- 解析 CSS
- 计算样式
- 布局
- 处理图层
- 每秒把页面画 60 次
- 执行全局 JS 代码
- 执行事件处理函数
- 执行计时器的回调函数
- ......
思考题:为什么渲染进程不适用多个线程来处理这些事情?
渲染主线程不适用多个线程来处理任务的原因主要包括:
- 1.状态共享复杂:
-
- 渲染过程中涉及大量状态共享,如 DOM 树、CSSOM 树、布局信息等。多线程环境下,这些状态的同步和一致性维护非常复杂,容易引入竞态条件和死锁等问题。
- 2.性能开销:
-
- 线程间的通信和同步机制本身会带来额外的性能开销。对于浏览器这种需要频繁更新和渲染的环境,过多的线程间通信可能会导致性能下降。
- 3.现有架构限制:
-
- 当前大多数浏览器的架构设计都是基于单线程模型,改变这一模型需要对整个浏览器引擎进行大规模重构,这不仅工作量巨大,而且风险很高。
- 4.JavaScript 单线程特性:
-
- JavaScript 是单线程语言,所有 JavaScript 代码都在主线程上执行。如果渲染进程采用多线程,如何与 JavaScript 代码协调成为一个难题。
- 5.复杂度增加:
-
- 多线程编程本身就比单线程编程复杂得多,引入多线程会增加浏览器开发和维护的难度。
尽管如此,现代浏览器已经开始探索多线程和并行计算的方法,例如将某些计算密集型任务(如图像处理、Web Workers 中的 JavaScript 执行)交给工作线程处理,以减轻主线程的压力。
2.渲染进程如何处理这些工作?
要处理这么多的任务,主线程遇到了一个前所未有的难题:如何调度任务?
比如:
- 我正在执行一个 JS 函数,执行到一半的时候用户点击了按钮,我该立即去执行点击事件的处理函数吗?
- 我正在执行一个 JS 函数,执行到一半的时候某个计时器到达了时间,我该立即去执行它的回调吗?
- 浏览器进程通知我“用户点击了按钮”,与此同时,某个计时器也到达了时间,我应该处理哪一个呢?
- ......
渲染主线程想出了一个绝妙的主意来处理这个问题:排队
- 在最开始的时候,渲染主线程会进入一个无限循环
- 每一次循环会检查消息队列中是否有任务存在。如果有,就取出第一个任务执行,执行完一个后进入下一次循环;如果没有,则进入休眠状态。
- 其他所有线程(包括其他进程的线程)可以随时向消息队列添加任务。新任务会加到消息队列的末尾。在添加新任务时,如果主线程是休眠状态,则会将其唤醒以继续循环拿取任务
这样一来,就可以让每个任务有条不紊的、持续的进行下去了。
整个过程,被称之为事件循环(消息循环)
3.面试题
1.何为异步?
代码在执行过程中,会遇到一些无法立即处理的任务,比如:
- 计时完成后需要执行的任务 ——
setTimeout
、setInterval
- 网络通信完成后需要执行的任务 --
XHR
、Fetch
- 用户操作后需要执行的任务 --
addEventListener
如果让渲染主线程等待这些任务的时机达到,就会导致主线程长期处于「阻塞」的状态,从而导致浏览器「卡死」
渲染主线程承担着极其重要的工作,无论如何都不能阻塞!
因此,浏览器选择异步来解决这个问题(调用其他进程的线程如JavaScript 引擎线程,网络线程来处理这些任务并把他们放在消息队列之中)
使用异步的方式,渲染主线程永不阻塞!
面试题:如何理解 JS 的异步?
标准答案:
1.JS是一门单线程的语言,这是因为它运行在浏览器的渲染主线程中,而渲染主线程只有一个。
2.而渲染主线程承担着诸多的工作,渲染页面、执行 JS 都在其中运行。(是什么)
3.如果使用同步的方式,就极有可能导致主线程产生阻塞,从而导致消息队列中的很多其他任务无法得到执行。这样一来,一方面会导致繁忙的主线程白白的消耗时间,另一方面导致页面无法及时更新,给用户造成卡死现象。(为什么)
4.所以浏览器采用异步的方式来避免。具体做法是当某些任务发生时,比如计时器、网络、事件监听,主线程将任务交给其他线程去处理,自身立即结束任务的执行,转而执行后续代码。当其他线程完成时,将事先传递的回调函数包装成任务,加入到消息队列的末尾排队,等待主线程调度执行。(怎么做)
在这种异步模式下,浏览器永不阻塞,从而最大限度的保证了单线程的流畅运行。
2.js为何会阻塞渲染
<!DOCTYPE html>
<html lang="en"><head></head><body><h1>Mr.Yuan is awesome!</h1><button>change</button><script>var h1 = document.querySelector('h1');var btn = document.querySelector('button');// 死循环指定的时间function delay(duration) {var start = Date.now();while (Date.now() - start < duration) {}}btn.onclick = function () {h1.textContent = '你好';delay(3000);};</script></body>
</html>
此时代码会在三秒中之后修改,这是因为delay函数的缘故该代码要在三秒中之后才能被js引擎执行完成并放在渲染主线程中渲染,这就是js代码阻塞渲染
3.任务优先级
任务没有优先级,在消息队列中先进先出
但消息队列是有优先级的
根据 W3C 的最新解释:
- 每个任务都有一个任务类型,同一个类型的任务必须在一个队列,不同类型的任务可以分属于不同的队列。在一次事件循环中,浏览器可以根据实际情况从不同的队列中取出任务执行。
- 浏览器必须准备好一个微队列,微队列中的任务优先所有其他任务执行HTML Standard
随着浏览器的复杂度急剧提升,W3C 不再使用宏队列的说法
在目前 chrome 的实现中,至少包含了下面的队列:
- 延时队列:用于存放计时器到达后的回调任务,优先级「中」
- 交互队列:用于存放用户操作后产生的事件处理任务,优先级「高」
- 微队列:用户存放需要最快执行的任务,优先级「最高」
添加任务到微队列的主要方式主要是使用 Promise、MutationObserver
浏览器还有很多其他的队列,由于和我们开发关系不大,不作考虑
示例1
function a() {console.log(1);Promise.resolve().then(function () {console.log(2);});
}
setTimeout(function () {console.log(3);
}, 0);Promise.resolve().then(a);console.log(5);
该打印什么呢?我们来分析一下
第一步
第二步
第三步
第四步
面试题:阐述一下 JS 的事件循环
参考答案:
1.事件循环又叫做消息循环,是浏览器渲染主线程的工作方式。
2.在 Chrome 的源码中,它开启一个不会结束的 for 循环,每次循环从消息队列中取出第一个任务执行,而其他线程只需要在合适的时候将任务加入到队列末尾即可。(是什么)
3.过去把消息队列简单分为宏队列和微队列,这种说法目前已无法满足复杂的浏览器环境,取而代之的是一种更加灵活多变的处理方式。
4.根据 W3C 官方的解释,每个任务有不同的类型,同类型的任务必须在同一个队列,不同的任务可以属于不同的队列。不同任务队列有不同的优先级,在一次事件循环中,由浏览器自行决定取哪一个队列的任务。但浏览器必须有一个微队列,微队列的任务一定具有最高的优先级,必须优先调度执行。(怎么做)
面试题:JS 中的计时器能做到精确计时吗?为什么?
参考答案:
不行,因为:
- 计算机硬件没有原子钟,无法做到精确计时
- 操作系统的计时函数本身就有少量偏差,由于 JS 的计时器最终调用的是操作系统的函数,也就携带了这些偏差
- 按照 W3C 的标准,浏览器实现计时器时,如果嵌套层级超过 5 层,则会带有 4 毫秒的最少时间,这样在计时时间少于 4 毫秒时又带来了偏差
- 受事件循环的影响,计时器的回调函数只能在主线程空闲时运行,因此又带来了偏差