浏览器内核、页面呈现原理及其优化

来源于:http://yangfch3.com/2017/03/04/%E6%B5%8F%E8%A7%88%E5%99%A8%E5%86%85%E6%A0%B8%E3%80%81%E9%A1%B5%E9%9D%A2%E5%91%88%E7%8E%B0%E5%8E%9F%E7%90%86%E5%8F%8A%E5%85%B6%E4%BC%98%E5%8C%96/

介绍浏览器内核、页面呈现原理等基础知识,同时根据原理提出页面呈现优化方案。

浏览器内核

浏览器内核又叫渲染引擎,主要负责 HTML、CSS 的解析,页面布局、渲染与复合层合成。浏览器内核的不同带来的主要问题是对 CSS 的支持度与属性表现差异。

现在主流的内核有:Blink、Webkit、Gecko、EdgeHTML、Trident,这里面有几个需要注意的地方:

  1. Blink 是在 Webkit 的基础上的改进,是现在对新特性支持度最好的内核

  2. 移动端基本上全部是 Webkit 或 Blink 内核(除去 Android 上腾讯家的 X5),这两个内核对新特性的支持度较高,所以新特性可以在移动端大展身手。

  3. Trident 是 IE4+ 的内核,一直持续到 IE11,EdgeHTML 是微软抛弃 IE 后开发的全新内核

  4. 更多资料请看附录表格

几种渲染模式

一般现代浏览器都会有以下几种渲染模式:

  1. 标准模式
  2. 接近标准模式(又称有限怪异模式)
  3. 怪异模式

不同渲染模式出现的原因

在 IE5 与 NS4 那个年代,浏览器大战,标准未立,Web 则在经历早期快速地发展。

后来标准逐步建立,新标准的规范与以前 IE5、NS4 的实现存在着不可避免的差异差异,但是此时的网络世界许许多多旧时的页面正在运行,如果按照新标准的实现来渲染的话会有大量的问题出现。

所以此时大部分现代浏览器厂商想到了区别性地使用不同渲染模式来对待这些 Web 页面。

而 IE 随着升级,对现代标准的支持也越来越完善,所以 IE 为了正常渲染旧时页面,支持我们指定哪个版本的 IE 模式来渲染页面

总结就是:

  1. 怪异模式是 IE5 与 NS4 年代遗留问题的回退方案
  2. 怪异模式在大部分浏览器都有部署,并且能在一定的机制下触发

不同渲染模式的触发

标准未立之前,HTML 文档是没有文档头的,同时在 HTML5 之前的 HTML4/3 的文档头都有各自的特征,所以在大部分现代浏览器下触发的机制如下:

  1. 无 DOCTYPE 头触发怪异模式

  2. DOCTYPE 头不正确(不是 html)也触发怪异模式

    如:<!DOCTYPE svg>

  3. DOCTYPE 头为 HTML3 头触发怪异模式

  4. DOCTYPE 头为 HTML4 头则触发接近标准模式(或称有限怪异模式

  5. 常见的 HTML5 DOCTYPE 声明则使用标准模式

在 IE 下,除了文档头的差异可以自动触发渲染模式的选择,我们还能手动指定(在 IE8+ 适用)使用哪个版本的 IE 渲染模式来渲染我们的页面(扩展阅读):

1
2
3
4
5
6
7
8
9
<!-- 使用当前操作系统已装的最新的 IE -->
<!-- chrome=1 是针对双核浏览器使优先使用 Chrome -->
<meta http-equiv="x-ua-compatible" content="ie=edge,chrome=1">
 
<!-- 使用 IE9 -->
<meta http-equiv="x-ua-compatible" content="ie=9">
 
<!-- 如果你需要使用 IE5 的怪异模式 -->
<meta http-equiv="x-ua-compatible" content="ie=5">

不同渲染模式的表现差异

怪异模式与标准模式

  1. 怪异模式使用不同于标准的盒模型(也就相当于 IE8+ 下的:box-sizing: border-box
  2. 怪异模式下某些行内(inline)元素的垂直对齐行为表现怪异:怪异模式下对齐图片至包含它们的盒子的下边框,而 标准模式图片对其到父盒的 baseline

接近标准模式(有限怪异模式)与标准模式

主要区别即为上面的第 2 点

JavaScript 引擎

JavaScript 负责 JavaScript 代码的解释与执行,主流的 JavaScript 引擎有:V8、SpiderMonkey、JavaScriptCore、Chakra。

浏览器与引擎详情见附录表格。

页面呈现原理

当我们点击一个链接,服务器将 HTML 代码传输到我们的浏览器,浏览器在接收到这份 HTML 代码之后是如何一步步将页面呈现出来的呢?这里面浏览器需要做哪些工作?如何优化呈现的过程提升 Web 应用质量?

六部曲

一个页面的呈现,粗略的说会经过以下这些步骤:

  1. DOM 树的构建(Parse HTML)

  2. 构建 CSSOM 树(Recaculate Style)

    为什么是 Re-caculate Style 呢?这是因为浏览器本身有 User Agent StyleSheet,所以最终的样式是我们的样式代码样式与用户代理默认样式覆盖/重新计算得到的。

  3. 合并 DOM 树与 CSSOM 树为 Render 树

  4. 布局(Layout)

  5. 绘制(Paint)

  6. 复合图层化(Composite)

    图层化是自己理解后形象的意译

其中布局(Layout)环节主要负责各元素尺寸、位置的计算,绘制(Paint)环节则是绘制页面像素信息,合成(Composite)环节是多个复合层的合成,最终合成的页面被用户看到。

六部曲中的阻塞

虽然六部曲看似和谐,分工合作,有序进行。但是实际上这里面却是波云诡谲,风起云涌,就像平时的工作一样,看似你和我各司其职,分工明确,但是实际干起活来却可能因为某一个人的某一环而阻滞整个进度。

我们来分析这六部曲中存在的阻塞问题:

  1. 当遇到 JavaScript 脚本或者外部 JavaScript 代码时,浏览器便停止 DOM 的构建(阻塞 1

    那是否停下 DOM 的构建的同时,立马就执行 JavaScript 代码或者下载外部脚本执行,其实还是要视情况而定,见 2

  2. 当遇到 <script> 标签需要执行脚本代码时,浏览器会检查是否这个 <script> 标签以上的 CSS 文件是否已经加载并用于构建了 CSSOM,如果 <script> 上部还有 CSS 样式没加载,则浏览器会等待 <script> 上方样式的加载完成才会执行该 <script> 内的脚本(阻塞 2

  3. DOM 树与 CSSOM 树的成功构建是后面步骤的根基(同步阻塞

  4. 同时外部脚本、外部样式表的下载也是耗费时间较多的点

六部曲之 DOM 树的构建

image_1ba5aftnnm7i11t8kl716c2164o9.png-96.9kB
浏览器构建 DOM 树可以简单的总结为以下几步:

  1. 转码(Bytes -> Characters)—— 读取接收到的 HTML 二进制数据,按指定编码格式将字节转换为 HTML 字符串

  2. Tokens 化(Characters -> Tokens)—— 解析 HTML,将 HTML 字符串转换为结构清晰的 Tokens,每个 Token 都有特殊的含义同时有自己的一套规则

  3. 构建 Nodes(Tokens -> Nodes)—— 每个 Node 都添加特定的属性(或属性访问器),通过指针能够确定 Node 的父、子、兄弟关系和所属 treeScope(例如:iframe 的 treeScope 与外层页面的 treeScope 不同)
    image_1ba5an0vmfsn1kb928a1lv8vkpm.png-49.2kB

  4. 构建 DOM 树(Nodes -> DOM Tree)—— 最重要的工作是建立起每个结点的父子兄弟关系

在 Chrome 开发者工具下 Timeline 面板的 Parse HTML 阶段对应着 DOM 树的构建


扩展阅读:[从Chrome源码看浏览器如何构建DOM树 ](https://zhuanlan.zhihu.com/p/24911872?refer=dreawer) > 留意这篇文章的这些点: > > 1. DOM 构建时对 DOCType 处理 > 2. DOCType 的不同或漏缺带来的文档解析模式(怪异模式、有限怪异模式、标准模式)的影响 > 3. 处理开标签与闭标签的压栈、弹栈处理 > 4. Chromium 对待自定义标签的处理 > 5. JavaScript 方法查找 DOM 的过程,使用 ID、类名、复杂选择器查找 DOM 的对比

六部曲之 CSSOM 树的构建

CSSOM 树的构建 “原料” 的来源有:外部 CSS 文件、内部样式、内联样式

CSSOM 树的构建其实是一个 样式的重新计算 的过程,为什么是重新计算呢?

用户代理(即浏览器)本身有一套内置样式表,所以我们最终的 CSSOM 树其实是用户代理样式与页面所有样式的重新计算

所以在 Chrome 浏览器开发者工具的 Timeline 面板下,CSSOM 树的构建对应的是 Recalculate Style 阶段

与 DOM 树的构建过程相似,CSSOM 的构建也要经历以下过程:
image_1ba7m6adr1h52bm2mblup214t59.png-10.3kB

最终构建的 CSSOM 树大致如下:
image_1ba7m7h67t731ikr1461topakgm.png-42.2kB

六部曲之渲染树的构建

  1. DOM 树与 CSSOM 树融合成渲染树

  2. 渲染树只包括渲染页面需要的节点

    排除 <script> <meta> 等功能化、非视觉节点
    排除 display: none 的节点

image_1ba7mjun4h4l123b1smn13indhg13.png-116.2kB

六部曲之布局

Layout 阶段做的工作:确定页面各元素的位置、尺寸。

Layout 在 Chrome 开发者工具 Timeline 面板中被归并到 Paint 阶段

当元素某些样式变更/JavaScript 执行某些样式请求,会导致 Layout trashing,又叫做回流(Reflow)。

六部曲之绘制

一旦布局(Layout)步骤完成,浏览器便触发 “Paint Setup” 与 “Paint” 事件(渲染引擎底层概念),执行 paint 操作,结合渲染树与布局信息绘制实际像素

注:在 Timeline 工具内,Layout 与 Paint 两个过程被统一归并到 Paint 阶段。

六部曲之复合图层化

在很多情况下,我们不会将复合图层化归入页面呈现的必要过程。图层化是浏览器为了充分利用已有渲染成果(缓存渲染成果),最小化 GPU 运算,将“脏区”提升为复合图层,隔离变化影响的操作。

见 链接

页面性能优化

知道了页面渲染的原理,那么我们也就得到了页面性能优化的依据。提炼六部曲中每一步的优化空间,针对六部曲中的每一步提出针对性的优化方案也就能达到我们最终的优化目的。

优化不可避免的阻塞:优化关键呈现路径

关键呈现路径里的一些概念

  • 关键资源:可能阻止网页首次呈现的资源。
  • 关键路径长度:即往返过程数量,或提取所有关键资源所需的总时间。
  • 关键字节:实现网页首次呈现所需的总字节数,是所有关键资源的传输文件大小总和。 带有一个 HTML 网页的首个示例包含一项关键资源(HTML 文档),关键路径长度也与 1 个网络往返过程(假设文件较小)相等,而且总的关键字节数正好是 HTML 文档本身的传输大小。

优化关键呈现路径的指导原则

  • 尽量减少关键资源数量。
  • 尽量减少关键字节数。
  • 尽量缩短关键路径的长度。

优化关键呈现路径常规步骤

  1. 分析和描述关键路径:资源数量、字节数、长度。
  2. 尽量减少关键资源数量:删除相应资源、延迟下载、标记为异步资源等等。
  3. 优化剩余关键资源的加载顺序:你需要尽早下载所有关键资源,以缩短关键路径长度。
  4. 尽量减少关键字节数,以缩短下载时间(和往返次数)。

优化关键呈现路径的具体建议

  1. 文件合并、压缩

  2. 推荐使用异步(async) JavaScript 资源,或使用延迟(defer)执行的 JavaScript

  3. 一般 <script> 脚本的靠后书写

  4. 避免运行时间长的 JavaScript,耗时任务的拆分,chunk 化运行

    例如:使用定时器将大任务拆分为小任务,使得浏览器得到空隙做其他事情。

  5. 避免使用 CSS import

  6. 内联、内部化阻止呈现的 CSS

    一般不采用,百度、Google 这样的极度重视性能与体验的服务才可能这样做。

针对复合图层化的优化

因为浏览器有图层化这个机制,那么我们就搞懂它并充分利用吧。

复合图层化机制

某些属性的变更(transformopacity)满足以下条件:

  • 不影响文档流。
  • 不依赖文档流。
  • 不会造成重绘。

那么这些属性变更时就需要一种机制:机制需要能将属性变更的部分与页面其他部分隔离开来,其他部分已经渲染完好进行缓存,变更的部分在单独的图层上进行,然后对缓存的部分与变更的图层进行合成。

所以图层化的关键字:缓存隔离图层合成

使用 transform 与 opacity 进行属性变更是经典的符合图层化方法,以下是其他会提升元素为复合图层的场景

  1. 3d 或透视变换 CSS 属性,例如 translate3dtranslateZ 等等(JS 一般通过这种方式,使元素获得复合图层)
  2. <video> <iframe> <canvas> <webgl> 等元素。
  3. 混合插件(如flash)。
  4. 元素自身的 opacity 和 transform 做 CSS 动画。
  5. 拥有 CSS Filter 的元素。
  6. 使用 will-change 属性。
  7. position:fixed
  8. 元素有一个 z-index 较低且包含一个复合层的兄弟元素(换句话说就是该元素在复合层上方)

图层化的优势

很容易看出来:充分利用缓存、隔离的思想,无需像回流、重绘那么大性能(GPU、CPU)开支,图层化能带来动画性能的提升。

图层化的潜在问题 —— 内存开销

那么图层化的弊端在哪里呢?

因为图层化的存在,每个图层对需要在内存中存储该图层相关的信息,当图层太多会造成内存开销过大的情况(如下图)。

![image_1baah8s0vcol3464t21foe1sb91g.png-31.3kB][7]
同样表现的页面,单图层与多图层的内存开销

因为开销,所以节制

内存开销在桌面端可能还能接受,但是在资源有限的移动端,复合图层过多便可能导致内存开支过大,页面反而变得停滞、卡顿,甚至浏览器假死,系统无法正常运行。

针对回流的优化

  1. CSS Triggers

    1. CSS3 > JavaScript
    2. 属性变更优先考虑顺序(性能表现排序)
      1. transfromopacity
      2. background-color 等
      3. position - top bottom left right
      4. width height 等
      5. marginpaddingborder
  2. What forces layout

    JavaScript 存在这样的机制:当连续有大量 DOM 样式的操作时,出于性能考虑,防止零碎变更导致频繁的回流、重绘,会尽可能地将这些操作先缓存起来,然后一次性地变更。这个机制我们难以察觉但是确实存在。

    然而当我们进行某些 DOM 样式的读、写时,出于时效性的考虑,则会立即触发浏览器回流、重绘以返回正确、合理的值。

其他优化技巧

节流函数

已经比较明白了,那就略吧

惰性载入函数

也已经比较明白,也略吧

重任务分片多帧

实例讲解

Timeline 工具

使用 Timeline 工具我们能做以下事:

  1. 页面渲染帧率分析,得到异常帧信息
  2. 各类文件执行耗时/耗资源分析
  3. 文件等待 - 下载时间
  4. 页面呈现期间的事件列表
  5. 某个帧/某个事件的详细信息分析

image_1ba7qi29r1b5f12c7tvh1muh9rm.png-524.5kB

理解 Timeline 工具使用,读懂这图就够了

image_1ba7rnvjs4gb1l35b6a1d9r3db34.png-28.7kB

常用事件,更多事件见[扩展阅读](#扩展阅读)

而我们在日常开发中,用 Timeline 最多的场景是:

  1. 编写动画,Debug 不流畅的异常帧,针对性优化(见本章扩展阅读一节)
  2. 侦测 重新计算样式重新布局重绘重新合成 等事件,针对性优化
  3. 了解 JavaScript 函数调用栈以及函数调用带来的回流/重绘事件信息
  4. 查看在某个事件中代码的执行耗时(点击上图 Main 部分,点击下方常驻 Panel 内与文件相关的可点击链接)
    image_1ba7rah2h136v1keujkjbn7pmv2a.png-152.8kB

让你的 Timeline 调试更强大

  1. 选择性地开启以下开关
    image_1ba7qso561sv3ep6lur1civ1vba13.png-49.2kB

  2. 开启开发者工具实验性特性开关
    image_1ba7r0k4u12du17j819kkvcqgfv1t.png-405.1kB

    image_1ba7r0cuochpk331s6810jq1t8n1g.png-60.6kB

扩展阅读

Timeline 官方简介
Timeline 事件参考
推荐:Timeline 进行帧分析,避免页面卡顿

附录

浏览器内核与 JS 引擎一览

浏览器/RunTime内核(渲染引擎)JavaScript 引擎
Chrome Blink(28~)
Webkit(Chrome 27)
V8
FireFox Gecko SpiderMonkey
Safari Webkit JavaScriptCore
Edge EdgeHTML Chakra(for JavaScript)
IE Trident Chakra(for JScript)
PhantomJS Webkit JavaScriptCore
Node.js - V8
posted @ 2017-06-11 16:59  一个勤奋的胖子  阅读(5620)  评论(0编辑  收藏  举报