TL;DR: 当我们在做性能优化的时候，我们究竟在优化什么？做性能优化需不需要了解底层的东西？需要了解到什么程度？浏览器底层是一个什么架构？浏览器渲染的本质究竟是什么？哪些方面对用户的体验影响才是最大的？有没有业内一些通用的标准或标杆参考？都1202年了，雅虎军规还有没有用？性能分析工具都有哪些？我们从哪方面进行分析才是合适的？腾讯文档遇到过什么性能问题？

本文为你一一解答这些问题。了解了这些问题，可能你在做性能优化的时候才能更加得心应手。

1. 性能优化的本质
- 1.1 展示更快，响应更快
- 1.2 理解浏览器多进程架构
- 1.3 理解页面渲染相关进程
  - 1.3.1 Renderer Process & GPU Process
  - 1.3.2 Renderer Process详解
    - 1.3.2.1 Main Thread
2. 看看经典：雅虎军规
3. 性能指标
- 3.1 什么样的性能指标才能真正代表用户体验？
- 3.2 Core Web Vitals
  - 3.2.1 Largest Contenful Paint(LCP)
    - 3.2.1.1 LCP如何定义
    - 3.2.1.2 如何测量LCP
    - 3.2.1.3 如何优化LCP
  - 3.2.2 First Input Delay(FID)
    - 3.2.2.1 FID如何定义
    - 3.2.2.2 如何测量FID
    - 3.2.2.3 如何优化FID
  - 3.2.3 Cumulative Layout Shift(CLS)
    - 3.2.3.1 CLS如何定义
    - 3.2.3.2 如何测量CLS
    - 3.2.3.3 如何优化CLS
4. 性能工具：共欲善其事，必先利其器
- 4.1 Lighthouse
- 4.2 PageSpeed Insights
- 4.3 CrUX
- 4.4 Chrome DevTools Performance面板
  - 4.4.1 Frame
  - 4.4.2 Timings
  - 4.4.3 Main
  - 4.4.4 Layers
  - 4.4.5 Rendering
    - 4.4.5.1 Paint flashing
    - 4.4.5.2 Layout Shift Regions
    - 4.4.5.3 Frame Rendering Stats
  - 4.4.6 Memory
- 4.5 Search Console
- 4.6 web.dev
- 4.7 Web Vitals extension
- 4.8 工具思考与总结
5. 腾讯文档性能优化
- 5.1 滑动性能优化
  - 5.1.1 过程
  - 5.1.2 总结
6. 谈谈监控
7. 总结

1. 性能优化的本质

1.1 展示更快，响应更快

性能优化的目的，就是为了提供给用户更好的体验，这些体验包含这几个方面：展示更快、交互响应快、页面无卡顿情况。

更详细的说，就是指，在用户输入url到站点完整把整个页面展示出来的过程中，通过各种优化策略和方法，让页面加载更快；在用户使用过程中，让用户的操作响应更及时，有更好的用户体验。

对于前端工程师来说，要做好性能优化，需要理解浏览器加载和渲染的本质。理解了本质原理，才能更好的去做优化。所以我们先来看看浏览器架构是怎样的。

1.2 理解浏览器多进程架构

从大的方面来说，浏览器是一个多进程架构。

它可以是一个进程包含多个线程，也可以是多个进程中，每个进程有多个线程，线程之间通过IPC通讯。每个浏览器有不同的实现细节，并没有标准规定浏览器必须如何去实现。

这里我们只谈论chrome架构。

下面这张图是目前chrome的多进程架构图。性能优化到底应该如何做 (图片引自Mariko Kosaka的《Inside look at modern web browser》)

我们来看看这些进程分别对应浏览器窗口中的哪一部分：性能优化到底应该如何做 (图片引自Mariko Kosaka的《Inside look at modern web browser》)

那么，怎么看浏览器对应启动了什么进程呢？ chrome中，我们可以通过更多->More Tools->Task Manager看到启动的进程。性能优化到底应该如何做

从chrome官网和源码，我们也可以得知，多进程架构中包含这些进程：

Browser进程：打开浏览器后，始终只有一个。该进程有UI线程、Network线程、Storage线程等。用户输入url后，首先是Browser进程进行响应和请求服务器获取数据。然后传递给Renderer进程。
Renderer进程：每一个tab一个，负责html、css、js执行的整个过程。 前端性能优化也与这个进程有关 。
Plugin进程：与浏览器插件相关，例如flash等。
GPU进程：浏览器共用一个。主要负责把Renderer进程中绘制好的tile位图作为纹理上传到GPU，并调用GPU相关方法把纹理draw到屏幕上。

这里的话只是简单介绍一下浏览器的多进程架构，让大家对浏览器整体架构有个初步认识，其实背后的细节还有很多，这里就不一一展开。有兴趣可以细看这一系列文章和chrome官网介绍。

1.3 理解页面渲染相关进程

1.3.1 Renderer Process & GPU Process

从以上的多架构，我们了解到，与前端渲染、性能优化相关的，其实主要是Renderer进程和GPU进程。那么，它们又是什么架构呢？

来看一下这张我们再熟悉不过的图。性能优化到底应该如何做 (图片引自Paul的《The Anatomy of a Frame》)

Renderer进程：包括3个线程。合成线程（Compositor Thread）、主线程（Main Thread）、Compositor Tile Worker。
GPU进程：只有GPU线程，负责接收从Renderer进程中的Compositor Thread传过来的纹理，显示到屏幕上。

1.3.2 Renderer Process详解

Renderer进程中3个线程的作用为：

Compositor Thread：首先接收vsync信号(vsync信号是指操作系统指示浏览器去绘制新的帧)，任何事件都会先到达Compositor线程。如果主线程没有绑定事件，那么Compositor线程将避免进入主线程，并尝试将输入转换为屏幕上的移动。它将更新的图层位置信息作为帧通过GPU线程传递给GPU进行绘制。

当用户在快速滑动过程中，如果主线程没有绑定事件，Compositor线程是可以快速响应并绘制的 ，这是浏览器做的一个优化。

Main Thread：主线程就是我们前端工程师熟知的线程，这里会执行解析Html、样式计算、布局、绘制、合成等动作。所以关于性能的问题，都发生在了这里。所以应该重点关注这里。
Compositor Tile Worker：由合成线程产生一个或多个worker来处理光栅化的工作。

Service Workers和Web Workers可以暂时理解也在Renderer进程中，这里不展开讨论。

1.3.2.1 Main Thread

性能优化到底应该如何做

主线程需要重点讲下。因为这是我们的代码真实存在的环境。

从上一小节Render进程和GPU进程的图中，我们可以看到有个红色的箭头，从Recal Styles和Layout指向了requestAnimationFrame，这意味着有Forced Synchronous Layout (or Styles)(强制回流和重绘)发生，这一点在性能方面特别要注意。

在Main Thread中，有这几个需要注意一下：

requestAnimationFrame：因为布局和样式计算是在rAF之后，所以在rAF是进行元素变更的理想时机。如果在这里对一个元素变更100个类，不会进行100次计算，它们会分批以后处理。需要注意的是，不能在rAF中查询任何计算样式和布局的属性（例如：el.style.backgroundImage或el.style.offsetWidth），因为这样会导致重绘和回流。
Layout：布局的计算通常是针对整个文档的，并且与DOM元素的大小成正比！（这点特别要注意，如果一个页面DOM元素太多，也会导致性能问题）

主线程的顺序始终都是：Input Event Handler->requestAnimationFrame->ParseHtml->ReculateStyles->Layout->Update Layer Tree->Paint->Composite->commit->requestIdleCallback，只能从前往后，例如，必须先是ReculateStyles，然后Layout、然后Paint。但是，如果它只需要做最后一步Paint，那么这就是它全部要做的事情，不会再发生前面的ReculateStyles和Layout。

这里其实给了我们一个启示： 如果要让fps保持60，即每帧的js执行时间少于16.66ms，那么让这个主线程执行的过程尽可能地少，是我们的性能优化目标 。

根据主线程的这些步骤，理想的情况下，我们只希望浏览器只发生最后一个步骤：Composite(合成)。

CSS的属性是我们需要关注一下的模块。这里描述了哪些CSS属性会引起重绘、回流和合成。例如，让我们给一个元素进行移动位置时： transform 和 opacity 可以直接触发合成，但是 left 和 top 却会触发Layout、Paint、Composite3个动作。所以显然用transform时更好的方案。

但这并不是说我们不应该用left和top这些可能引起重绘回流的属性，而是应该关注每个属性在浏览器性能中引起的效果 。

2. 看看经典：雅虎军规

多年前雅虎的Nicolas C. Zakas提出7个类别35条军规，至今为止很多前端优化准则都是围绕着这个展开。如果严格按照这些规则去做，其实我们有很多优化工作可以做，只要认真践行，性能提升不是问题。

性能优化到底应该如何做

我们来看看它7个分类都是围绕哪些方面展开：

Server：与页面发起请求的相关；
Cookie：与页面发起请求相关；
Mobile：与页面请求相关；
Content：与页面渲染相关；
Image：与页面渲染相关；
CSS：与页面渲染相关；
Javascript：与页面渲染和交互相关。

从上面的描述可以看到，其实雅虎军规，是围绕页面发起请求那一刻，到页面渲染完成，页面开始交互这几个方面来展开，提出的一些原则。

很多原则大家也都耳熟能详，就不全部展开了，有兴趣的同学可以去查看原文。这里主要想提一些忽略但是又值得注意的点：

减少DOM节点数量

为什么要减少DOM节点的数量？当遍历查询500和5000个DOM节点，进行事件绑定时，会有所差别。当一个页面DOM节点过多，应该考虑使用无限滚动方案来使视窗节点可控。可以看看google提的方案。

减少cookie大小

cookie 传输会造成带宽浪费，影响响应时间，可以这样做：消除不必要的cookies；静态资源不需要 cookie，可以采用其他的域名，不会主动带上 cookie。

避免图片src为空

图片src为空时，不同浏览器会有不同的副作用，会重新发起一起请求。

3. 性能指标

3.1 什么样的性能指标才能真正代表用户体验？

思考点	详细内容
Is it happening?	导航是否成功，服务器是否响应了	Is it useful?	是否已经渲染了足够的内容，让用户可以开始参与其中	Is it usable?	用户是否可以与页面交互，页面是否处于繁忙状态	Is it delightful?	交互是否流畅、自然、没有滞后反映或卡顿

通常有2种途径来衡量性能。

本地实验衡量：本地模拟用户的网络、设备等情况进行测试。通常在开发新功能的时候，实验测量是很重要的，因为我们不知道这个功能发布到线上会有什么性能问题，所以提前进行性能测试，可以进行预防。
线上衡量：实验测量固然可以反映一些问题，但无法反映在用户那里真实的情况。同样的，在用户那里，性能问题会和用户的设备、网络情况有关，而且还跟用户如何与页面进行交互有关。

有这几个类型与用户感知性能相关。

页面加载时间：页面以多快的速度加载和渲染元素到页面上。
加载后响应时间：页面加载和执行js代码后多久能响应用户交互。
运行时响应：页面加载完成后，对用户的交互响应时间。
视觉稳定性：页面元素是否会以用户不期望的方式移动，并干扰用户的交互。
流畅度：过渡和动画是否以一致的帧率渲染，并从一种状态流畅地过渡到另一种状态。

对应上面几种分类，Google和W3C性能工作组提供了对应这几种性能指标：

First contentful paint (FCP): 测量页面开始加载到某一块内容显示在页面上的时间。
Largest contentful paint (LCP): 测量页面开始加载到最大文本块内容或图片显示在页面中的时间。
First input delay (FID): 测量用户首次与网站进行交互(例如点击一个链接、按钮、js自定义控件)到浏览器真正进行响应的时间。
Time to Interactive (TTI): 测量从页面加载到可视化呈现、页面初始化脚本已经加载，并且可以可靠地快速响应用户的时间。
Total blocking time (TBT): 测量从FCP到TTI之间的时间，这个时间内主线程被阻塞无法响应用户输入。
Cumulative layout shift (CLS): 测量从页面开始加载到状态变为隐藏过程中，发生不可预期的layout shifts的累积分数。

这些指标能从一定程度上衡量页面性能，但不一定都是有效的。举个例子。LCP指标主要用户衡量页面的主要内容是否完成加载，但会有这样的情况，最大的元素并不是主要内容，那么这个时候LCP指标并不是那么重要。每个不同的站点有自己的特殊性，可以参考以上角度进行衡量，也需要因地制宜。

3.2 Core Web Vitals

在以上列出的指标中，Google定义了3个最核心的指标，作为Core Web Vitals。它们分别代表着：加载、交互、视觉稳定性。

性能优化到底应该如何做

Largest Contentful Paint (LCP): 测量加载性能。为了能提供较好的用户体验，LCP指标建议页面首次加载要在2.5s内完成。
First Input Delay (FID): 测量交互性能。为了提供较好用户体验，交互时间建议在100ms或以内。
Cumulative Layout Shift (CLS): 测量视觉稳定性。为了提供较好用户体验，页面应该维持CLS在0.1或以内。

当页面访问量有75%的数据达到了以上以上Good的标准，则认为性能是不错的了。

Core Web Vitals是作为核心性能指标，但是其他指标也同样在重要，是做为核心指标的一个辅助。例如，TTFB和FCP都可以用来衡量加载性能(服务器响应时间和渲染时间)，它们作为LCP的一个问题手段辅助。同样的，TBT和TTI对于衡量交互性能也很重要，是FID的一个辅助，但是它们无法在线上进行测量，也无法反映以用户为中心的结果。

Google官方提供了一个web-vitals库，线上或本地都可以测量上面提到的3个指标：

import {getCLS, getFID, getLCP} from 'web-vitals';

function sendToAnalytics(metric) {
  const body = JSON.stringify(metric);
  // Use `navigator.sendBeacon()` if available, falling back to `fetch()`.
  (navigator.sendBeacon && navigator.sendBeacon('/analytics', body)) ||
      fetch('/analytics', {body, method: 'POST', keepalive: true});
}

getCLS(sendToAnalytics);
getFID(sendToAnalytics);
getLCP(sendToAnalytics);

下面，分别讲讲这3个指标定义的原因、如何测量、如何优化。

3.2.1 Largest Contentful Paint (LCP)

3.2.1.1 LCP如何定义

性能优化到底应该如何做 (图片来自LCP)

LCP是指页面开始加载到最大文本块内容或图片显示在页面中的时间。那么哪些元素可以被定义为最大元素呢？

<img>标签
<image> 在svg中的image标签
<video> video标签
CSS background url()加载的图片
包含内联或文本的块级元素

3.2.1.2 如何测量LCP

线上测量工具

Chrome User Experience Report
PageSpeed Insights
Search Console (Core Web Vitals report)
web-vitals JavaScript library

实验室工具

Chrome DevTools
Lighthouse
WebPageTest

原生的JS API测量 LCP还可以用JS API进行测量，主要使用PerformanceObserver接口，目前除了IE不支持，其他浏览器基本都支持了。

new PerformanceObserver((entryList) => {
  for (const entry of entryList.getEntries()) {
    console.log('LCP candidate:', entry.startTime, entry);
  }
}).observe({type: 'largest-contentful-paint', buffered: true});

我们看一下结果是怎样的：

性能优化到底应该如何做

Google官方web-vitals库 Google官方也提供了一个web-vitals库，底层还是使用这个API，只是帮我们处理了一些需要测量和不需测量的场景、以及一些细节问题。

3.2.1.3 如何优化LCP

LCP可能被这四个因素影响：

服务端响应时间
Javascript和CSS引起的渲染卡顿
资源加载时间
客户端渲染

更加详细的优化建议就不展开了，可以参考这里。

3.2.2 First Input Delay (FID)

3.2.2.1 FID如何定义

性能优化到底应该如何做 (图片来自FID)

我们都知道第一印象的重要性，比如初次遇到某人形成的印象，会在后续交往中起重要的影响。对于一个网站也是如此。

网站以多快的速度加载完成是其中一项指标，加载后以多快的速度对用户进行响应也同样重要。FID就是指后者。

可以通过下面的图来更详细了解FID处于哪个位置：

性能优化到底应该如何做 (图片来自FID)

从上图可以看出，当主线程处于繁忙的时候，FID是指从浏览器接收到了用户输入，到浏览器对用户的输入进行响应的延迟时间。

通常，当我们在写代码的时候，会认为只要用户输入信息，我们的事件回调就会立刻响应，但实际上并不是这样。这是主线程可能处于繁忙，浏览器正忙着解析和执行其他js。如上图所示的FID时间，主线程正在处理其他任务。

当FID的时间为100ms或以内，则为Good。

上面的例子中，用户刚好在主线程最繁忙的时刻进行了交互，但是如果用户在主线程空闲的时候交互，那么浏览器可以立刻响应。所以FID的值需要重点查看它的分布情况。

FID实际上测量的是输入事件被感知到到主线程空闲的这段时间。这意味着即使没有输入事件被注册，FID也可以测量。因为用户的输入相应并不一定需要事件被执行，但一定需要主线程是空闲的。例如，下面这些HTML元素都需要在交互响应之前等待主线程上的正在执行的任务完成：

输入框，例如<input>、<textarea>、<radio>、<checkbox>
下拉框，例如<select>
链接，例如<a>

为什么要考虑测量第一次的输入延迟？有如下原因：

因为第一次输入延迟是用户对你的网站形成的第一个印象，网站是否有质量且可靠；
在今天，web中最大的交互问题第一次加载之后；
对于网站应该如何解决较高的首次输入延迟(例如代码分割、减少JavaScript的预加载)的建议解决方案(TTI是指衡量这一块)，不一定与在页面加载后解决输入延迟(FID是指衡量这一块)的解决方案相同。所以FID是在TTI的基础上更精确的细分。

为什么FID只是包含从用户输入到主线程开始相应的时间？而没有包含事件处理到浏览器绘制UI的时间？

尽管主线程处理和绘制的这段时间也很重要，但是如果FID把这段时间也包含进来，开发者可能会使用异步API(例如setTimeout、requestAnimationFrame)来把这个task拆分到下一帧，以较少FID的时间，这样不仅没有提高用户体验，反而使用户体验降低。

3.2.2.2 如何测量FID

FID可以在实验环境也可以在线上环境测量。

线上测量工具

Chrome User Experience Report
PageSpeed Insights
Search Console (Core Web Vitals report)
web-vitals JavaScript library

原生的JS API测量

new PerformanceObserver((entryList) => {
  for (const entry of entryList.getEntries()) {
    const delay = entry.processingStart - entry.startTime;
    console.log('FID candidate:', delay, entry);
  }
}).observe({type: 'first-input', buffered: true});

PerformanceObserver目前除了在IE上没有兼容，其他浏览器基本都兼容了。

我们看一下结果是怎样的：

性能优化到底应该如何做

3.2.2.3 如何优化FID

FID可能被这四个因素影响：

减少第三方代码的影响
减少Javascript的执行时间
最小化主线程工作
减小请求数量和请求文件大小

更加详细的优化建议可以参考这里。

3.2.3 Cumulative Layout Shift (CLS)

3.2.3.1 CLS如何定义

性能优化到底应该如何做 (图片来自CLS)

CLS是一个非常重要的、以用户为中心的测量指标。它能衡量页面是否排版稳定。

页面移动会经常发生在资源异步加载、或者DOM元素动态添加到已存在的页面元素上面。这些元素有可能是图片、视频、第三方广告或小图标等。

但是我们开发过程中可能不会察觉到这些问题，因为调试过程中刷新页面，图片都已经缓存在本地。调试接口的时候我们使用的是mock或者在局域网，接口速度都很快，这些延迟都可能被我们忽略。

CLS就是帮我们去发现这些真实发生在用户端的问题的指标。

CLS是测量页面生命周期中，每个发生意外布局移动的分数。当一个可视元素在下一帧移动到另外一个位置，就是指布局移动。

CLS的分数在0.1或以下，则为Good。

那么意外布局移动的分数如何计算？

浏览器会监控两桢之间发生移动的不稳定元素。布局移动分数由2个元素决定：impact fraction和distance fraction。

layout shift score = impact fraction * distance fraction

可视区域内，在前一帧到下一帧之间所有不稳定的元素的并集，会影响当前帧的布局移动分数。

举个例子，下面这张图中，左边是当前帧的一个元素，下一帧中，元素下移了可视区域内25%的高度。红色虚线框标出了两桢中当前元素的并集，占适口的75%，所以这个时候，impact faction是0.75。

另外一个影响布局移动分数的是distance fraction，指这个元素相对视口移动的距离。不管是横向还是竖向，取最大值。

下面例子中，竖向距离更大，该元素相对适口移动了25%的距离，所以distance fraction是0.25。所以布局移动分数是 0.75 * 0.25 = 0.1875.

性能优化到底应该如何做

但是要注意的是，并不是所有的布局移动都是不好的，很多web网站都会改变元素的开始位置。只有当布局移动是非用户预期的，才是不好的。

换句话说，当用户点击了按钮，布局进行了改动，这是ok的，CLS的JS API中有一个字段hadRecentInput，用来标识500ms内是否有用户数据，视情况而定，可以忽略这个计算。

3.2.3.2 如何测量CLS

线上测量工具

Chrome User Experience Report
PageSpeed Insights
Search Console (Core Web Vitals report)
web-vitals JavaScript library

实验室工具

Chrome DevTools
Lighthouse
WebPageTest

原生的JS API测量

let cls = 0;

new PerformanceObserver((entryList) => {
  for (const entry of entryList.getEntries()) {
    if (!entry.hadRecentInput) {
      cls += entry.value;
      console.log('Current CLS value:', cls, entry);
    }
  }
}).observe({type: 'layout-shift', buffered: true});

我们看一下结果是怎样的：

性能优化到底应该如何做

3.2.3.3 如何优化CLS

我们可以根据这些原则来避免非预期布局移动：

图片或视屏元素有大小属性，或者给他们保留一个空间大小，设置width、height，或者使用unsized-media feature policy。
不要在一个已存在的元素上面插入内容，除了相应用户输入。
使用animation或transition而不是直接触发布局改变。

更详细的内容可以看这里。

4. 性能工具：工欲善其事，必先利其器

Google开发的所有工具都支持Core Web Vitals的测量。工具如下：

Lighthouse
PageSpeed Insights
Chrome DevTools
Search Console
web.dev's提供的测量工具
Web Vitals扩展
Chrome UX Report API

性能优化到底应该如何做

这些工具对Core Web Vitals的支持如下：

性能优化到底应该如何做

4.1 Lighthouse

打开F12，就可以看到Lighthouse，点击Generate Report，即可生成报告。当然也可以添加chrome插件使用。

性能优化到底应该如何做

Lighthhouse是一个实验室工具，本地模拟移动端和PC端对这几个方面进行测试。同时lighthouse还会针对这几个方面提出建议，在产品上线前值得一测。

性能优化到底应该如何做

Lighthouse还提供了Lighthouse CI，把Lighthouse集成到CI流水线中。举个例子，每次在上线之前，跑50次流水线对Lighthouse的各项指标进行测试取平均值，一旦发现异常，立刻进行排查。把性能问题排查提前到发布之前。这块后面会细讲。

4.2 PageSpeed Insights

PageSpeed Insights(PSI)是一个可以分析线上和实验室数据的工具。它是根据线上环境用户真实的数据(在Chrome UX 报告中)和Lighthouse结合出一份报告。和Lighthouse类似，它也会给出一些分析建议，可以知道页面的Core Web Vitals是否达标。

性能优化到底应该如何做

PageSpeed只是提供对单个页面的性能测试，而Search Console是正对整个网站的性能测试。

PageSpeed Insights也提供了API供我们使用。同样的，我们也可以把它集成到CI中。

4.3 CrUX

Chrome UX Report (CrUX)是指汇聚了成千上万条用户体验数据的数据报告集，它是经过用户同意才进行上报的，目前存储在Google BigQuery上，可以使用账号登陆进行查询。它测量了所有的Core Web Vitals指标。

上面提到的PageSpeed Insights工具就是结合CrUX的数据进行分析给出的结论。

当然CrUX现在也提供了API共我们进行查询，可以查询的数据包括：

Largest Contentful Paint
Cumulative Layout Shift
First Input Delay
First Contentful Paint

原理如下：

性能优化到底应该如何做

通过API的查询的数据每日都更新，并汇集了过去28天的数据。

具体的使用方式可以参考官方给出的demo。

4.4 Chrome DevTools Performance面板

Performance是我们最常用的本地性能分析工具。

性能优化到底应该如何做

这里像提几点可以关注下的功能：Frame、Timings、Main、Layers、FPS。下面一一讲解。

4.4.1 Frame

点击Frame展开后，会看到有一个一个红色或绿色小块，这些代表着每帧的消耗时间。目前大多数设备的屏幕刷新率为 60 次/秒，浏览器渲染页面的每一帧的速率如果与设备屏幕的刷新率保持一致，即60fps时，我们是不会感知到页面卡的情况的。

我们把鼠标移上去看看：

性能优化到底应该如何做

这种体验顺畅的情况。

再比如：性能优化到底应该如何做

提示这一帧耗时了30.9ms，当前是32fps并且是掉帧状态。

4.4.2 Timings

这里可以看到几个关键指标的时间点。

FP：First Paint；
FCP：First Contentful Paint；
LCP：Largest Contenful Paint；
DCL：DOMContentLoaded Event
L：OnLoad Event。

性能优化到底应该如何做

4.4.3 Main

Main是DevTools中最常用也是最重要的功能。

性能优化到底应该如何做

通过record，我们可以查看页面上所有操作在主线程中的执行过程。也就是我们常说的流程：

性能优化到底应该如何做

一旦有任何一个流程时间过长或频繁发生，比如Update Layer Tree时间过长、频繁出现RecalcStyles、Layout(重绘回流)，那么需要引起注意。后面会举一个例子。

4.4.4 Layers

Layers是浏览器在绘制过程中生成的一个层。因为浏览器底层渲染的本质是纵向分层、横向分块。这一块的知识点是发生在Renderer Process进程中。后面会以一个例子展开讲。

这里想提Layers的原因是，Layer的渲染也会影响性能问题，而且有时候还不容易被发现！

Layers面板一般不会默认展示出来，点击更多->more tools->Layers即可打开。

性能优化到底应该如何做

点击Layers面板，点击左边下三角展开按钮，可以看见页面最终生成的合成层。右边左上角可以选择不同纬度进行查看。

性能优化到底应该如何做

选中某个层，可以查看该层生成的原因。

性能优化到底应该如何做

Chrome的Blink内核给出了54种会生成合成层的原因：

constexpr CompositingReasonStringMap kCompositingReasonsStringMap[] = {
    {CompositingReason::k3DTransform, "transform3D", "Has a 3d transform"},
    {CompositingReason::kTrivial3DTransform, "trivialTransform3D",
     "Has a trivial 3d transform"},
    {CompositingReason::kVideo, "video", "Is an accelerated video"},
    {CompositingReason::kCanvas, "canvas",
     "Is an accelerated canvas, or is a display list backed canvas that was "
     "promoted to a layer based on a performance heuristic."},
    {CompositingReason::kPlugin, "plugin", "Is an accelerated plugin"},
    {CompositingReason::kIFrame, "iFrame", "Is an accelerated iFrame"},
    {CompositingReason::kSVGRoot, "SVGRoot", "Is an accelerated SVG root"},
    {CompositingReason::kBackfaceVisibilityHidden, "backfaceVisibilityHidden",
     "Has backface-visibility: hidden"},
    {CompositingReason::kActiveTransformAnimation, "activeTransformAnimation",
     "Has an active accelerated transform animation or transition"},
    {CompositingReason::kActiveOpacityAnimation, "activeOpacityAnimation",
     "Has an active accelerated opacity animation or transition"},
    {CompositingReason::kActiveFilterAnimation, "activeFilterAnimation",
     "Has an active accelerated filter animation or transition"},
    {CompositingReason::kActiveBackdropFilterAnimation,
     "activeBackdropFilterAnimation",
     "Has an active accelerated backdrop filter animation or transition"},
    {CompositingReason::kXrOverlay, "xrOverlay",
     "Is DOM overlay for WebXR immersive-ar mode"},
    {CompositingReason::kScrollDependentPosition, "scrollDependentPosition",
     "Is fixed or sticky position"},
    {CompositingReason::kOverflowScrolling, "overflowScrolling",
     "Is a scrollable overflow element"},
    {CompositingReason::kOverflowScrollingParent, "overflowScrollingParent",
     "Scroll parent is not an ancestor"},
    {CompositingReason::kOutOfFlowClipping, "outOfFlowClipping",
     "Has clipping ancestor"},
    {CompositingReason::kVideoOverlay, "videoOverlay",
     "Is overlay controls for video"},
    {CompositingReason::kWillChangeTransform, "willChangeTransform",
     "Has a will-change: transform compositing hint"},
    {CompositingReason::kWillChangeOpacity, "willChangeOpacity",
     "Has a will-change: opacity compositing hint"},
    {CompositingReason::kWillChangeFilter, "willChangeFilter",
     "Has a will-change: filter compositing hint"},
    {CompositingReason::kWillChangeBackdropFilter, "willChangeBackdropFilter",
     "Has a will-change: backdrop-filter compositing hint"},
    {CompositingReason::kWillChangeOther, "willChangeOther",
     "Has a will-change compositing hint other than transform and opacity"},
    {CompositingReason::kBackdropFilter, "backdropFilter",
     "Has a backdrop filter"},
    {CompositingReason::kBackdropFilterMask, "backdropFilterMask",
     "Is a mask for backdrop filter"},
    {CompositingReason::kRootScroller, "rootScroller",
     "Is the document.rootScroller"},
    {CompositingReason::kAssumedOverlap, "assumedOverlap",
     "Might overlap other composited content"},
    {CompositingReason::kOverlap, "overlap",
     "Overlaps other composited content"},
    {CompositingReason::kNegativeZIndexChildren, "negativeZIndexChildren",
     "Parent with composited negative z-index content"},
    {CompositingReason::kSquashingDisallowed, "squashingDisallowed",
     "Layer was separately composited because it could not be squashed."},
    {CompositingReason::kOpacityWithCompositedDescendants,
     "opacityWithCompositedDescendants",
     "Has opacity that needs to be applied by compositor because of composited "
     "descendants"},
    {CompositingReason::kMaskWithCompositedDescendants,
     "maskWithCompositedDescendants",
     "Has a mask that needs to be known by compositor because of composited "
     "descendants"},
    {CompositingReason::kReflectionWithCompositedDescendants,
     "reflectionWithCompositedDescendants",
     "Has a reflection that needs to be known by compositor because of "
     "composited descendants"},
    {CompositingReason::kFilterWithCompositedDescendants,
     "filterWithCompositedDescendants",
     "Has a filter effect that needs to be known by compositor because of "
     "composited descendants"},
    {CompositingReason::kBlendingWithCompositedDescendants,
     "blendingWithCompositedDescendants",
     "Has a blending effect that needs to be known by compositor because of "
     "composited descendants"},
    {CompositingReason::kPerspectiveWith3DDescendants,
     "perspectiveWith3DDescendants",
     "Has a perspective transform that needs to be known by compositor because "
     "of 3d descendants"},
    {CompositingReason::kPreserve3DWith3DDescendants,
     "preserve3DWith3DDescendants",
     "Has a preserves-3d property that needs to be known by compositor because "
     "of 3d descendants"},
    {CompositingReason::kIsolateCompositedDescendants,
     "isolateCompositedDescendants",
     "Should isolate descendants to apply a blend effect"},
    {CompositingReason::kFullscreenVideoWithCompositedDescendants,
     "fullscreenVideoWithCompositedDescendants",
     "Is a fullscreen video element with composited descendants"},
    {CompositingReason::kRoot, "root", "Is the root layer"},
    {CompositingReason::kLayerForHorizontalScrollbar,
     "layerForHorizontalScrollbar",
     "Secondary layer, the horizontal scrollbar layer"},
    {CompositingReason::kLayerForVerticalScrollbar, "layerForVerticalScrollbar",
     "Secondary layer, the vertical scrollbar layer"},
    {CompositingReason::kLayerForScrollCorner, "layerForScrollCorner",
     "Secondary layer, the scroll corner layer"},
    {CompositingReason::kLayerForScrollingContents, "layerForScrollingContents",
     "Secondary layer, to house contents that can be scrolled"},
    {CompositingReason::kLayerForSquashingContents, "layerForSquashingContents",
     "Secondary layer, home for a group of squashable content"},
    {CompositingReason::kLayerForForeground, "layerForForeground",
     "Secondary layer, to contain any normal flow and positive z-index "
     "contents on top of a negative z-index layer"},
    {CompositingReason::kLayerForMask, "layerForMask",
     "Secondary layer, to contain the mask contents"},
    {CompositingReason::kLayerForDecoration, "layerForDecoration",
     "Layer painted on top of other layers as decoration"},
    {CompositingReason::kLayerForOther, "layerForOther",
     "Layer for link highlight, frame overlay, etc."},
    {CompositingReason::kBackfaceInvisibility3DAncestor,
     "BackfaceInvisibility3DAncestor",
     "Ancestor in same 3D rendering context has a hidden backface"},
};

4.4.5 Rendering

Rendering面板也隐藏了很多好用的功能。

4.4.5.1 Paint flashing

勾选了Paint flashing后，我们就会看到页面上有哪些内容被重绘了：

性能优化到底应该如何做

4.4.5.2 Layout Shift Regions

勾选了Layout Shift Regions后，进行交互，就可以看到哪些元素进行了布局移动：

性能优化到底应该如何做

4.4.5.3 Frame Rendering Stats

这个工具有一个小插曲。

Frame Rendering Stats的前身是FPS meter，在Google版本85.0.4181.0改成了Frame Rendering Stats，但是迫于用户抱怨，在90版本的时候又改回来了。

Frame Rendering Stats主要显示不掉帧率。而FPS侧重于显示每秒的刷新率fps。

Chrome为什么要改成不掉帧率，是因为认为不掉帧率更能反映页面的顺畅度。而FPS显示每一秒渲染的帧数虽然能一定程度反映页面顺畅度，但是在一些特殊情况例如没有激活或空闲的页面，fps会比较低，这样并不能反映真实情况。

性能优化到底应该如何做 (图片引自blink dev论坛讨论)

4.4.6 Memory

在大型项目中，内存问题也是有发生。DevTools也提供了内存分析工具供我们使用。

点击Memory面板，点击录制按钮。

性能优化到底应该如何做

点击录制后，会看到当前状态下内存的占用情况，根据大小排序，我们可以定位到内存占用过多的地方。

性能优化到底应该如何做

4.5 Search Console

Google Search Console其实就是监控和维护网站在 Google 搜索结果中的展示情况以及排查问题的平台。数据来源是CrUX。

它会展示3个 Core Web Vitals metrics: LCP, FID, CLS。如果发现有问题，可以配合PageSpeed一起使用，分析问题。

性能优化到底应该如何做 (图片引自vital-tools)

4.6 web.dev

web.dev/measure是google官方提供的测量性能工具，也会提供类似PageSpeed Insight的指标，还会提供一些具体代码更改建议。

性能优化到底应该如何做

4.7 Web Vitals extension

Google也提供了扩展工具去测量Core Web Vitals。可以从Store中进行安装。

性能优化到底应该如何做

4.8 工具：思考与总结

当我们了解了这么多工具之后，琳琅满目，我们该如何选择？如何使用好这些工具进行分析？

首先我们可以使用Lighthouse，在本地进行测量，根据报告给出的一些建议进行优化；
发布之后，我们可以使用PageSpeed Insights去看下线上的性能情况；
接着，我们可以使用Chrome User Experience Report API去捞取线上过去28天的数据；
发现数据有异常，我们可以使用DevTools工具进行具体代码定位分析；
使用Search Console's Core Web Vitals report查看网站功能整体情况；
使用Web Vitals扩展方便的看页面核心指标情况；

5. 腾讯文档性能优化

前面碎碎念念讲了这么多，终于来到了最后的实战环节。下面以腾讯文档为例子，讲讲我们定义了指标并且遇到过哪些比较难处理的性能问题。目前也在持续优化中。

首屏
- 首屏时间FCP：与Web Core Vitals定义的FCP类似，不过根据文档内容显示时间来自定义。
- 可交互时间TTI：因为文档是在线编辑器，移动端下可交互我们认为是键盘可以弹起的时间
内存：运行期间占用内存情况
crash：线上统计页面无响应率
fps：主要测量滑动fps
卡顿
- 运行期间不卡顿比例：衡量编辑期间不卡顿比例
- 每打开一次文档出现卡顿次：编辑期间整体卡顿情况
成功率
- 白屏比例：页面白屏情况
- js报错率：检查代码是否健康
- 数据落盘成功率：数据是否保存成功

从上面可以看出，我们主要围绕首屏加载、首屏可交互时间、交互情况、页面报错率、数据成功率、滑动顺畅度等维度进行优化的。

5.1 滑动性能优化

5.1.1 过程

滑动性能的故事是这样子的。

曾经，低端手机下，腾讯文档滑动很卡。通过竞品分析，我们发现石墨、飞书滑动非常顺畅。

而移动端下，腾讯文档采用懒渲染方式，石墨飞书采用的是全量渲染，所以我们第一个怀疑方向是懒渲染。是不是因为懒渲染，js执行时间过长，主线程绘制过程有问题，导致加载慢，才导致滑动卡？带着这样的疑问，我们使用了全量渲染进行测试。但是，当全量渲染完成后，滑动依旧卡顿，使用perfdog测量的数据如下：性能优化到底应该如何做

这个时候，我们开始去研究源码，对比了下腾讯文档与石墨、飞书的滑动代码处理，发现了一个异常：石墨、飞书scroll事件断点后不会卡住，而腾讯文档会被卡住。

那这个时候我们有2个疑问：

疑问1: 打点后为什么可以滑动
疑问2: 这个卡住会不会影响滑动性能

如果我们不了解浏览器进程下多线程的架构，那这个时候肯定一脸懵逼，无从下手。

性能优化到底应该如何做

我们在来回顾一下这张图：性能优化到底应该如何做

前面有提到在Renderer进程中存在这样一个线程：Compositor Thread(合成线程)。这个线程主要干什么事情呢？

Compositor Thread和Main Thread同样拥有绘制帧的信息。Compositor Thread会先接受到输入的vsync信号，处理滚动页面，不需要等待主线程执行完才commit给GPU线程绘制屏幕。

快速滑动的时候，合成线程会快速处理屏幕显示，所以会看到低分辨率的信息。

你会发现，合成线程可以优先处理滚动事件，而不需要等待主线程执行完才进行滚动，这也导致Touch事件可以执行e.preventDefault()，而scroll事件不能执行e.preventDefault()。(Chrome官网)

到此为止，我们知道原来滑动断点卡住可能是因为Compositor Thread处理滑动失效。当我们把罪魁祸首找到，原来是workbench-float-widgets节点挡在编辑器节点上面，导致合成线程对scroll优化失效

性能优化到底应该如何做

当我们把这个节点层级调整到编辑器下面后，在进行滑动测量，似乎不会那么卡了。并且数据也有所提升：

性能优化到底应该如何做

滑动fps从20上升至40左右，但卡顿率依旧很高。

那么我们继续分析，进行Performance录制。

性能优化到底应该如何做

发现一个异常，Update Layer Tree时间很长，Update Layer Tree又是一个什么东西？

通过前面的学习，我们知道Update Layer Tree是跟层有关系的一个过程。那这个时候，我们需要更深入的理解Layer形成的过程。

这里只做一个简单介绍，细节就不展开了，展开又是一个很长的篇幅。具体可以看Chrome的官方文档。

浏览器渲染的本质是：纵向分层、横向分块。

性能优化到底应该如何做

从DOM Tree到Layer Tree会经过这样的过程：

性能优化到底应该如何做（图片来自Chrome的官方文档）

最新的代码已经讲Render Object改为Layout Object，Render Layer改为Paint Layer了。

所以Layer会经历从Render Layer到Graphics Layer的过程（当然，内核还会有其他Layer去处理中间态，这里我们就暂以官方文档的图为准）：

性能优化到底应该如何做

上图中，CompositedLayerMapping就是我们前面提到的54个会提升为合成层的理由。RenderLayer是一个中间态，GraphicsLayer才是我们在Layer面板中看到的那个Layer。在看这个问题的时候，我们打开Layer面板，并没有看到很多Layer。

我们再来看看官方文档是如何解释Layer生成的原因和过程的：性能优化到底应该如何做

我们注意到其中有一项，当CSS中有position:relative时，会生成Render Layer。于是乎我们找到了罪魁祸首。

性能优化到底应该如何做

当我们把这个问题解决后，滑动顺畅了很多，fps也提升了不少：

性能优化到底应该如何做

顺着这个Layer的问题，我们继续分析。滑动过程，我们打开Layer面板，发现滑动过程有很多个Layer出现。

性能优化到底应该如何做

再一次的，通过上面的学习，我们已经知道Layer的过程，是先生成Render Layer，再生成Graphics Layer，如果这个过程中无法命中层压缩，那就会生成合成层，最终显示在Layer面板中。

可以再次理解下这个过程：

性能优化到底应该如何做

命中无法层压缩原因：

性能优化到底应该如何做

至此，我们的滑动fps终于到达了58+。

性能优化到底应该如何做

5.1.2 总结

通过这个案例，其实是想引申出以下几个思考点：

当我们在做性能优化的时候，更多的应该从本质出发去思考这个问题为什么会存在；
有没有什么工具辅助我们去快速定位出这个问题；
认认真真把官方文档看一遍真的很重要，里面有很多隐藏的信息。知道了这些信息，会恍然大悟；

6. 谈谈监控

最后一个章节想来谈谈监控。

我们在做性能优化的时候，常常会通过各种线上打点，来收集用户数据，进行性能分析。没错，这是一种监控手段，更精确的说，这是一种"事后"监控手段。

**"事后"监控固然重要，但我们也应该考虑"事前"监控，否则，每次发布一个需求后，去线上看数据。咦，发现数据下降了，然后我们去查代码，去查数据，去查原因。这样性能优化的同学永远处于"追赶者"的角色，永远跟在屁股后面查问题。

举个例子，我们可以这样去做"事前"监控。

建立流水线机制。流水线上如何做呢？

Lighthouse CI 或 PageSpeed Insights API：把Lighthouse或PageSpeed Insights API集成到CI流水线中，输出报告分析。
Puppeteer 或 Playwright：使用E2E自动化测试工具集成到流水线模拟用户操作，得到Chrome Trace Files，也就是我们平常录制Performance后，点击左上角下载的文件。Puppeteer和Playwright底层都是基于Chrome DevTools Protocol。

性能优化到底应该如何做

Chrome Trace Files：根据规则分析Trace文件，可以得到每个函数执行的时间。如果函数执行时间超过了一个临界值，可以抛出异常。如果一个函数每次的执行时间都超过了临界值，那么就值得注意了。但是还有一点需要思考的是：函数执行的时间是否超过临界值固然重要，但更重要的是这是不是用户的输入响应函数，与用户体验是否有关。

性能优化到底应该如何做（图片来自Flo Sloot的Jank: You can measure what your users can feel.）

输出报告。定义异常临界值。如果异常过多，考虑是否卡发布流程。

7. 总结

终于到了我们的总结部分。我们来回顾一下前面的内容：

第一部分，讲了浏览器整体架构和渲染相关进程，为什么把这个章节也放到这篇性能优化的文章中？浏览器对于我们前端开发来说，是一个sandbox或者darkbox。我们知道js、html、css结合起来就能实现我们的需求，但如果知道它是如何去渲染、执行、处理我们的代码，不管是对做需求还是性能优化，都能更知其然和所以然。

第二部分，雅虎军规是多年前提出的非常经典的优化建议。至今对于我们依然有很强的指导作用。你会发现它是从页面加载、页面渲染、到页面交互全面的一个指导建议。与今天Chrome和W3c提出的Web Vitals思路依然类似。

第三部分，性能指标，参考标准与业内标杆的建议，能更好地指导我们进行优化。

第四部分，性能工具。工欲善其事，必先利其器。这个道理大家都懂，运用好工具，才能让我们更加事半功倍。

第五部分，以滑动性能优化为例子，让我们意识到理解原理(读书)的重要性。运用知识->结合工具->发现问题->发现本质问题->解决本质问题。

第六部分，监控在性能优化中占很重要的部分，"事前"监控更重要，防患于未然。让性能优化成为一个预防者而不是追赶者。

罗里吧嗦说了很多，当然还有很多性能优化的细节没有讲到，如果有错误的地方欢迎指正。或者有什么好方法好建议也强烈欢迎私聊交流一下～

性能优化到底应该如何做

参考文章： web.dev/learn-web-v…

developers.google.com/web/updates…

aerotwist.com/blog/the-an…

www.chromium.org/developers/…

medium.com/punching-pe…

1. 性能优化的本质

1.1 展示更快，响应更快

1.2 理解浏览器多进程架构

1.3 理解页面渲染相关进程

1.3.1 Renderer Process & GPU Process

1.3.2 Renderer Process详解

1.3.2.1 Main Thread

2. 看看经典：雅虎军规

3. 性能指标

3.1 什么样的性能指标才能真正代表用户体验？

3.2 Core Web Vitals

3.2.1 Largest Contentful Paint (LCP)

3.2.1.1 LCP如何定义

3.2.1.2 如何测量LCP

3.2.1.3 如何优化LCP

3.2.2 First Input Delay (FID)

3.2.2.1 FID如何定义

3.2.2.2 如何测量FID

3.2.2.3 如何优化FID

3.2.3 Cumulative Layout Shift (CLS)

3.2.3.1 CLS如何定义

3.2.3.2 如何测量CLS

3.2.3.3 如何优化CLS

4. 性能工具：工欲善其事，必先利其器

4.1 Lighthouse

4.2 PageSpeed Insights

4.3 CrUX

4.4 Chrome DevTools Performance面板

4.4.1 Frame

4.4.2 Timings

4.4.3 Main

4.4.4 Layers

4.4.5 Rendering

4.4.5.1 Paint flashing

4.4.5.2 Layout Shift Regions

4.4.5.3 Frame Rendering Stats

4.4.6 Memory

4.5 Search Console

4.6 web.dev

4.7 Web Vitals extension

4.8 工具：思考与总结

5. 腾讯文档性能优化

5.1 滑动性能优化

5.1.1 过程

5.1.2 总结

6. 谈谈监控

7. 总结

常见问题FAQ

掘金(小丹子) SVIP

相关推荐

发表评论

如需帝国cms功能定制以及二次开发请联系我们

升级SVIP会员

工作时间

请选择支付方式