React 16 加载性能优化指南（上）

今天是10.24程序员节

祝天下所有默默敲代码的程序猿们：

节日快乐，永葆秀发！

以下是正经的干货推送：

关于 React 应用加载的优化，其实网上类似的文章已经有太多太多了，随便一搜就是一堆，已经成为了一个老生常谈的问题。

但随着 React 16 和 Webpack 4.0 的发布，很多过去的优化手段其实都或多或少有些“过时”了，而正好最近一段时间，公司的新项目迁移到了 React 16 和 Webpack 4.0，做了很多这方面的优化，所以就写一篇文章来总结一下。

零、基础概念

我们先要明确一次页面加载过程是怎样的（这里我们暂时不讨论服务器端渲染的情况）。

用户打开页面，这个时候页面是完全空白的；

然后 html 和引用的 css 加载完毕，浏览器进行首次渲染，我们把首次渲染需要加载的资源体积称为 “首屏体积”；
然后 react、react-dom、业务代码加载完毕，应用第一次渲染，或者说首次内容渲染；
然后应用的代码开始执行，拉取数据、进行动态import、响应事件等等，完毕后页面进入可交互状态；
接下来 lazyload 的图片等多媒体内容开始逐渐加载完毕；
然后直到页面的其它资源（如错误上报组件、打点上报组件等）加载完毕，整个页面的加载就结束了。

所以接下来，我们就分别讨论这些步骤中，有哪些值得优化的点。

一. 打开页面 -> 首屏

写过 React 或者任何 SPA 的你，一定知道目前几乎所有流行的前端框架（React、Vue、Angular），它们的应用启动方式都是极其类似的：

html 中提供一个 root 节点

代码语言：javascript复制

<div id="root"></div>

把应用挂载到这个节点上

代码语言：javascript复制

ReactDOM.render(
  <App/>,
  document.getElementById('root')
);

这样的模式，使用 webpack 打包之后，一般就是三个文件：

一个体积很小、除了提供个 root 节点以外的没什么卵用的html（大概 1-4 KB）
一个体积很大的 js（50 - 1000 KB 不等）
一个 css 文件（当然如果你把 css 打进 js 里了，也可能没有）

这样造成的直接后果就是，用户在 50 - 1000 KB 的 js 文件加载、执行完毕之前，页面是完！全！空！白！的！

也就是说，这个时候：

代码语言：javascript复制

首屏体积（首次渲染需要加载的资源体积） = html   js   css

1.1. 在 root 节点中写一些东西

我们完全可以把首屏渲染的时间点提前，比如在你的 root 节点中写一点东西：

代码语言：javascript复制

<div class="root">Loading...</div>

就是这么简单，就可以把你应用的首屏时间提前到 html、css 加载完毕

此时：

代码语言：javascript复制

首屏体积 = html   css

当然一行没有样式的 “Loading…” 文本可能会让设计师想揍你一顿，为了避免被揍，我们可以在把 root 节点内的内容画得好看一些：

代码语言：javascript复制

<div id="root">
    <!-- 这里画一个 SVG -->
</div>

1.2. 使用 html-webpack-plugin 自动插入 loading

实际业务中肯定是有很多很多页面的，每个页面都要我们手动地复制粘贴这么一个 loading 态显然太不优雅了，这时我们可以考虑使用 html-webpack-plugin 来帮助我们自动插入 loading。

代码语言：javascript复制

var HtmlWebpackPlugin = require('html-webpack-plugin');
var path = require('path');

// 读取写好的 loading 态的 html 和 css
var loading = {
    html: fs.readFileSync(path.join(__dirname, './loading.html')),
    css: '<style>'   fs.readFileSync(path.join(__dirname, './loading.css'))   '</style>'
}
    
var webpackConfig = {
  entry: 'index.js',
  output: {
    path: path.resolve(__dirname, './dist'),
    filename: 'index_bundle.js'
  },
  plugins: [
    new HtmlWebpackPlugin({
      filename: 'xxxx.html',
      template: 'template.html',
      loading: loading
    })
  ]
};

然后在模板中引用即可：

代码语言：javascript复制

<!DOCTYPE html>
<html lang="en">
    <head>
        <%= htmlWebpackPlugin.options.loading.css %>
    </head>

    <body>
        <div id="root">
            <%= htmlWebpackPlugin.options.loading.html %>
        </div>
    </body>
</html>

1.3. 使用 prerender-spa-plugin 渲染首屏

在一些比较大型的项目中，Loading 可能本身就是一个 React/Vue 组件，在不做服务器端渲染的情况下，想把一个已经组件化的 Loading 直接写入 html 文件中会很复杂，不过依然有解决办法。

prerender-spa-plugin 是一个可以帮你在构建时就生成页面首屏 html 的一个 webpack 插件，原理大致如下：

指定 dist 目录和要渲染的路径
插件在 dist 目录中开启一个静态服务器，并且使用无头浏览器（puppeteer）访问对应的路径，执行 JS，抓取对应路径的 html。
把抓到的内容写入 html，这样即使没有做服务器端渲染，也能达到跟服务器端渲染几乎相同的作用（不考虑动态数据的话）

代码语言：javascript复制

plugins: [
  new PrerenderSpaPlugin(
    path.join(__dirname, 'dist'),
    [ '/', '/products/1', '/products/2', '/products/3']
  )
]

1.4. 除掉外链 css

截止到目前，我们的首屏体积 = html css，依然有优化的空间，那就是把外链的 css 去掉，让浏览器在加载完 html 时，即可渲染首屏。

实际上，webpack 默认就是没有外链 css 的，你什么都不需要做就可以了。当然如果你的项目之前配置了 extract-text-webpack-plugin 或者 mini-css-extract-plugin 来生成独立的 css 文件，直接去掉即可。

有人可能要质疑，把 css 打入 js 包里，会丢失浏览器很多缓存的好处（比如你只改了 js 代码，导致构建出的 js 内容变化，但连带 css 都要一起重新加载一次），这样做真的值得吗？

确实这么做会让 css 无法缓存，但实际上对于现在成熟的前端应用来说，缓存不应该在 js/css 这个维度上区分，而是应该按照“组件”区分，即配合动态 import 缓存组件。

接下来你会看到，css in js 的模式带来的好处远大于这么一丁点缺点。

二. 首屏 -> 首次内容渲染

这一段过程中，浏览器主要在做的事情就是加载、运行 JS 代码，所以如何提升 JS 代码的加载、运行性能，就成为了优化的关键。

几乎所有业务的 JS 代码，都可以大致划分成以下几个大块：

基础框架，如 React、Vue 等，这些基础框架的代码是不变的，除非升级框架；
Polyfill，对于使用了 ES2015 语法的项目来说，为了兼容性，polyfill 是必要的存在；
业务基础库，业务的一些通用的基础代码，不属于框架，但大部分业务都会使用到；
业务代码，特点是具体业务自身的逻辑代码。

想要优化这个时间段的性能，也就是要优化上面四种资源的加载速度。

2.1. 缓存基础框架

基础框架代码的特点就是必需且不变，是一种非常适合缓存的内容。

所以我们需要做的就是为基础框架代码设置一个尽量长的缓存时间，使用户的浏览器尽量通过缓存加载这些资源。

附：HTTP 缓存资源小结

HTTP 为我们提供了很好几种缓存的解决方案，不妨总结一下：

1. expires

代码语言：javascript复制

expires: Thu, 16 May 2019 03:05:59 GMT

在 http 头中设置一个过期时间，在这个过期时间之前，浏览器的请求都不会发出，而是自动从缓存中读取文件，除非缓存被清空，或者强制刷新。缺陷在于，服务器时间和用户端时间可能存在不一致，所以 HTTP/1.1 加入了 cache-control 头来改进这个问题。

2. cache-control

代码语言：javascript复制

cache-control: max-age=31536000

设置过期的时间长度（秒），在这个时间范围内，浏览器请求都会直接读缓存。当 expires和 cache-control 都存在时，cache-control 的优先级更高。

3. last-modified / if-modified-since

这是一组请求/相应头

响应头：

代码语言：javascript复制

last-modified: Wed, 16 May 2018 02:57:16 GMT

请求头：

代码语言：javascript复制

if-modified-since: Wed, 16 May 2018 05:55:38 GMT

服务器端返回资源时，如果头部带上了 last-modified，那么资源下次请求时就会把值加入到请求头 if-modified-since 中，服务器可以对比这个值，确定资源是否发生变化，如果没有发生变化，则返回 304。

4. etag / if-none-match

这也是一组请求/相应头

响应头：

代码语言：javascript复制

etag: "D5FC8B85A045FF720547BC36FC872550"

请求头：

代码语言：javascript复制

if-none-match: "D5FC8B85A045FF720547BC36FC872550"

原理类似，服务器端返回资源时，如果头部带上了 etag，那么资源下次请求时就会把值加入到请求头 if-none-match 中，服务器可以对比这个值，确定资源是否发生变化，如果没有发生变化，则返回 304。

上面四种缓存的优先级：cache-control > expires > etag > last-modified

2.2. 使用动态 polyfill

Polyfill 的特点是非必需和不变，因为对于一台手机来说，需要哪些 polyfill 是固定的，当然也可能完全不需要 polyfill。

现在为了浏览器的兼容性，我们常常引入各种 polyfill，但是在构建时静态地引入 polyfill 存在一些问题，比如对于机型和浏览器版本比较新的用户来说，他们完全不需要 polyfill，引入 polyfill 对于这部分用户来说是多余的，从而造成体积变大和性能损失。

比如 React 16 的代码中依赖了 ES6 的 Map/Set 对象，使用时需要你自己加入 polyfill，但目前几个完备的 Map/Set 的 polyfill 体积都比较大，打包进来会增大很多体积。

还比如 Promise 对象，实际上根据 caniuse.com 的数据，移动端上，中国接近 94% 的用户浏览器，都是原生支持 Promise 的，并不需要 polyfill。但实际上我们打包时还是会打包 Promise 的 polyfill，也就是说，我们为了 6% 的用户兼容性，增大了 94% 用户的加载体积。

所以这里的解决方法就是，去掉构建中静态的 polyfill，换而使用 polyfill.io 这样的动态 polyfill 服务，保证只有在需要时，才会引入 polyfill。

具体的使用方法非常简单，只需要外链一个 js：

代码语言：javascript复制

<script src="https://cdn.polyfill.io/v2/polyfill.min.js"></script>

当然这样是加载全部的 polyfill，实际上你可能并不需要这么多，比如你只需要 Map/Set 的话：

代码语言：javascript复制

<script src="https://cdn.polyfill.io/v2/polyfill.min.js?features=Map,Set"></script>

动态 polyfill 的原理

如果你用最新的 Chrome 浏览器访问这个链接的话：https://cdn.polyfill.io/v2/polyfill.js，你会发现内容几乎是空的：

如果打开控制台，模拟 iOS 的 Safari，再访问一次，你会发现里面就出现了一些 polyfill（URL 对象的 polyfill）：

这就是 polyfill.io 的原理，它会根据你的浏览器 UA 头，判断你是否支持某些特性，从而返回给你一个合适的 polyfill。对于最新的 Chrome 浏览器来说，不需要任何 polyfill，所以返回的内容为空。对于 iOS Safari 来说，需要 URL 对象的 polyfill，所以返回了对应的资源。

2.3. 使用 SplitChunksPlugin 自动拆分业务基础库

Webpack 4 抛弃了原有的 CommonChunksPlugin，换成了更为先进的 SplitChunksPlugin，用于提取公用代码。

它们的区别就在于，CommonChunksPlugin 会找到多数模块中都共有的东西，并且把它提取出来（common.js），也就意味着如果你加载了 common.js，那么里面可能会存在一些当前模块不需要的东西。

而 SplitChunksPlugin 采用了完全不同的 heuristics 方法，它会根据模块之间的依赖关系，自动打包出很多很多（而不是单个）通用模块，可以保证加载进来的代码一定是会被依赖到的。

下面是一个简单的例子，假设我们有 4 个 chunk，分别依赖了以下模块：

chunk	依赖模块
chunk-a	react, react-dom, componentA, utils
chunk-b	react, react-dom, componentB, utils
chunk-c	angular, componentC, utils
chunk-d	angular, componentD, utils

如果是以前的 CommonChunksPlugin，那么默认配置会把它们打包成下面这样：

包名	包含的模块
common	utils
chunk-a	react, react-dom, componentA
chunk-b	react, react-dom, componentB
chunk-c	angular, componentC
chunk-d	angular, componentD

显然在这里，react、react-dom、angular 这些公用的模块没有被抽出成为独立的包，存在进一步优化的空间。

现在，新的 SplitChunksPlugin 会把它们打包成以下几个包：

包名	包含的模块
chunk-a~chunk-b~chunk-c~chunk-d	utils
chunk-a~chunk-b	react, react-dom
chunk-c~chunk-d	angular
chunk-a	componentA
chunk-b	componentB
chunk-c	componentC
chunk-d	componentD

这就保证了所有公用的模块，都会被抽出成为独立的包，几乎完全避免了多页应用中，重复加载相同模块的问题。

具体如何配置 SplitChunksPlugin，请参考 webpack 官方文档。

注：目前使用 SplitChunksPlugin 存在的坑

虽然 webpack 4.0 提供的 SplitChunksPlugin 非常好用，但截止到写这篇文章的时候（2018年5月），依然存在一个坑，那就是 html-webpack-plugin 还不完全支持 SplitChunksPlugin，生成的公用模块包还无法自动注入到 html 中。

可以参考下面的 issue 或者 PR：

How to inject webpack 4 splited chunks. · Issue #882
allow to specify regexp as included or excluded chunks by mike1808 · Pull Request #881

2.4. 正确使用 Tree Shaking 减少业务代码体积

Tree Shaking 这已经是一个很久很久以前就存在的 webpack 特性了，老生常谈，但事实上不是所有的人（特别是对 webpack 不了解的人）都正确地使用了它，所以我今天要在这里啰嗦地再写一遍。

例如，我们有下面这样一个使用了 ES Module 标准的模块：

代码语言：javascript复制

// math.js
export function square(x) {
  return x * x
}
  
export function cube(x) {
  return x * x * x
}

然后你在另一个模块中引用了它：

代码语言：javascript复制

// index.js
import { cube } from './math'
cube(123)

经过 webpack 打包之后，math.js 会变成下面这样：

代码语言：javascript复制

/* 1 */
/***/ (function(module, __webpack_exports__, __webpack_require__) {

"use strict";
/* unused harmony export square */
/* harmony export (immutable) */ __webpack_exports__["a"] = cube;
function square(x) {
  return x * x;
}
  
function cube(x) {
  return x * x * x;
}

注意这里 square 函数依然存在，但多了一行 magic comment：unused harmony export square

随后的压缩代码的 uglifyJS 就会识别到这行 magic comment，并且把 square 函数丢弃。

但是一定要注意： webpack 2.0 开始原生支持 ES Module，也就是说不需要 babel 把 ES Module 转换成曾经的 commonjs 模块了，想用上 Tree Shaking，请务必关闭 babel 默认的模块转义：

代码语言：javascript复制

{
  "presets": [
    ["env", {
      "modules": false
      }
    }]
  ]
}

另外，Webpack 4.0 开始，Tree Shaking 对于那些无副作用的模块也会生效了。

如果你的一个模块在 package.json 中说明了这个模块没有副作用（也就是说执行其中的代码不会对环境有任何影响，例如只是声明了一些函数和常量）：

代码语言：javascript复制

{
  "name": "your-module",
  "sideEffects": false
}

那么在引入这个模块，却没有使用它时，webpack 会自动把它 Tree Shaking 丢掉：

代码语言：javascript复制

import yourModule from 'your-module'
// 下面没有用到 yourModule

这一点对于 lodash、underscore 这样的工具库来说尤其重要，开启了这个特性之后，你现在可以无心理负担地这样写了：

代码语言：javascript复制

import { capitalize } from 'lodash-es';
document.write(capitalize('yo'));

希望这篇文章，能拯救你下半年的 KPI ：）

P.S.还有文章的下半部分，周五再跟大家见面哟~

如果文章觉得不错，动动小手分享给小伙伴吧

------------------------------------------------------------------------

原文作者：腾讯工程师王伟嘉。

来源：腾讯内部KM论坛。

想玩转React？

想让下半年的KPI蹭蹭蹭的往上涨？

React实践宝典等你来撩~

前端NEXT学院-React课程火热招生中！

感兴趣的同学赶紧点击原文了解详情吧~

腾讯NEXT学位

求职干货 | 前辈blog | 前端课程

angularjs

0 人点赞