React 16 加载性能优化指南(上)

2018-10-24 19:24:18 浏览数 (1)

今天是10.24程序员节

祝天下所有默默敲代码的程序猿们:

节日快乐,永葆秀发!

以下是正经的干货推送:

关于 React 应用加载的优化,其实网上类似的文章已经有太多太多了,随便一搜就是一堆,已经成为了一个老生常谈的问题。

但随着 React 16 和 Webpack 4.0 的发布,很多过去的优化手段其实都或多或少有些“过时”了,而正好最近一段时间,公司的新项目迁移到了 React 16 和 Webpack 4.0,做了很多这方面的优化,所以就写一篇文章来总结一下。


零、基础概念

我们先要明确一次页面加载过程是怎样的(这里我们暂时不讨论服务器端渲染的情况)。

用户打开页面,这个时候页面是完全空白的;

  1. 然后 html 和引用的 css 加载完毕,浏览器进行首次渲染,我们把首次渲染需要加载的资源体积称为 “首屏体积”;
  2. 然后 react、react-dom、业务代码加载完毕,应用第一次渲染,或者说首次内容渲染;
  3. 然后应用的代码开始执行,拉取数据、进行动态import、响应事件等等,完毕后页面进入可交互状态;
  4. 接下来 lazyload 的图片等多媒体内容开始逐渐加载完毕;
  5. 然后直到页面的其它资源(如错误上报组件、打点上报组件等)加载完毕,整个页面的加载就结束了。

所以接下来,我们就分别讨论这些步骤中,有哪些值得优化的点。


一. 打开页面 -> 首屏

写过 React 或者任何 SPA 的你,一定知道目前几乎所有流行的前端框架(React、Vue、Angular),它们的应用启动方式都是极其类似的:

  1. html 中提供一个 root 节点
代码语言:javascript复制
<div id="root"></div>
  1. 把应用挂载到这个节点上
代码语言:javascript复制
ReactDOM.render(
  <App/>,
  document.getElementById('root')
);

这样的模式,使用 webpack 打包之后,一般就是三个文件:

  1. 一个体积很小、除了提供个 root 节点以外的没什么卵用的html(大概 1-4 KB)
  2. 一个体积很大的 js(50 - 1000 KB 不等)
  3. 一个 css 文件(当然如果你把 css 打进 js 里了,也可能没有)

这样造成的直接后果就是,用户在 50 - 1000 KB 的 js 文件加载、执行完毕之前,页面是 完!全!空!白!的!

也就是说,这个时候:

代码语言:javascript复制
首屏体积(首次渲染需要加载的资源体积) = html   js   css

1.1. 在 root 节点中写一些东西

我们完全可以把首屏渲染的时间点提前,比如在你的 root 节点中写一点东西:

代码语言:javascript复制
<div class="root">Loading...</div>

就是这么简单,就可以把你应用的首屏时间提前到 html、css 加载完毕

此时:

代码语言:javascript复制
首屏体积 = html   css

当然一行没有样式的 “Loading…” 文本可能会让设计师想揍你一顿,为了避免被揍,我们可以在把 root 节点内的内容画得好看一些:

代码语言:javascript复制
<div id="root">
    <!-- 这里画一个 SVG -->
</div>

1.2. 使用 html-webpack-plugin 自动插入 loading

实际业务中肯定是有很多很多页面的,每个页面都要我们手动地复制粘贴这么一个 loading 态显然太不优雅了,这时我们可以考虑使用 html-webpack-plugin 来帮助我们自动插入 loading。

代码语言:javascript复制
var HtmlWebpackPlugin = require('html-webpack-plugin');
var path = require('path');

// 读取写好的 loading 态的 html 和 css
var loading = {
    html: fs.readFileSync(path.join(__dirname, './loading.html')),
    css: '<style>'   fs.readFileSync(path.join(__dirname, './loading.css'))   '</style>'
}
    
var webpackConfig = {
  entry: 'index.js',
  output: {
    path: path.resolve(__dirname, './dist'),
    filename: 'index_bundle.js'
  },
  plugins: [
    new HtmlWebpackPlugin({
      filename: 'xxxx.html',
      template: 'template.html',
      loading: loading
    })
  ]
};

然后在模板中引用即可:

代码语言:javascript复制
<!DOCTYPE html>
<html lang="en">
    <head>
        <%= htmlWebpackPlugin.options.loading.css %>
    </head>

    <body>
        <div id="root">
            <%= htmlWebpackPlugin.options.loading.html %>
        </div>
    </body>
</html>

1.3. 使用 prerender-spa-plugin 渲染首屏

在一些比较大型的项目中,Loading 可能本身就是一个 React/Vue 组件,在不做服务器端渲染的情况下,想把一个已经组件化的 Loading 直接写入 html 文件中会很复杂,不过依然有解决办法。

prerender-spa-plugin 是一个可以帮你在构建时就生成页面首屏 html 的一个 webpack 插件,原理大致如下:

  1. 指定 dist 目录和要渲染的路径
  2. 插件在 dist 目录中开启一个静态服务器,并且使用无头浏览器(puppeteer)访问对应的路径,执行 JS,抓取对应路径的 html。
  3. 把抓到的内容写入 html,这样即使没有做服务器端渲染,也能达到跟服务器端渲染几乎相同的作用(不考虑动态数据的话)
代码语言:javascript复制
plugins: [
  new PrerenderSpaPlugin(
    path.join(__dirname, 'dist'),
    [ '/', '/products/1', '/products/2', '/products/3']
  )
]

1.4. 除掉外链 css

截止到目前,我们的首屏体积 = html css,依然有优化的空间,那就是把外链的 css 去掉,让浏览器在加载完 html 时,即可渲染首屏。

实际上,webpack 默认就是没有外链 css 的,你什么都不需要做就可以了。当然如果你的项目之前配置了 extract-text-webpack-plugin 或者 mini-css-extract-plugin 来生成独立的 css 文件,直接去掉即可。

有人可能要质疑,把 css 打入 js 包里,会丢失浏览器很多缓存的好处(比如你只改了 js 代码,导致构建出的 js 内容变化,但连带 css 都要一起重新加载一次),这样做真的值得吗?

确实这么做会让 css 无法缓存,但实际上对于现在成熟的前端应用来说,缓存不应该在 js/css 这个维度上区分,而是应该按照“组件”区分,即配合动态 import 缓存组件。

接下来你会看到,css in js 的模式带来的好处远大于这么一丁点缺点。


二. 首屏 -> 首次内容渲染

这一段过程中,浏览器主要在做的事情就是加载、运行 JS 代码,所以如何提升 JS 代码的加载、运行性能,就成为了优化的关键。

几乎所有业务的 JS 代码,都可以大致划分成以下几个大块:

  1. 基础框架,如 React、Vue 等,这些基础框架的代码是不变的,除非升级框架;
  2. Polyfill,对于使用了 ES2015 语法的项目来说,为了兼容性,polyfill 是必要的存在;
  3. 业务基础库,业务的一些通用的基础代码,不属于框架,但大部分业务都会使用到;
  4. 业务代码,特点是具体业务自身的逻辑代码。

想要优化这个时间段的性能,也就是要优化上面四种资源的加载速度。


2.1. 缓存基础框架

基础框架代码的特点就是必需且不变,是一种非常适合缓存的内容。

所以我们需要做的就是为基础框架代码设置一个尽量长的缓存时间,使用户的浏览器尽量通过缓存加载这些资源。

附:HTTP 缓存资源小结

HTTP 为我们提供了很好几种缓存的解决方案,不妨总结一下:

1. expires

代码语言:javascript复制
expires: Thu, 16 May 2019 03:05:59 GMT

在 http 头中设置一个过期时间,在这个过期时间之前,浏览器的请求都不会发出,而是自动从缓存中读取文件,除非缓存被清空,或者强制刷新。缺陷在于,服务器时间和用户端时间可能存在不一致,所以 HTTP/1.1 加入了 cache-control 头来改进这个问题。

2. cache-control
代码语言:javascript复制
cache-control: max-age=31536000

设置过期的时间长度(秒),在这个时间范围内,浏览器请求都会直接读缓存。当 expires和 cache-control 都存在时,cache-control 的优先级更高。

3. last-modified / if-modified-since

这是一组请求/相应头

响应头:

代码语言:javascript复制
last-modified: Wed, 16 May 2018 02:57:16 GMT

请求头:

代码语言:javascript复制
if-modified-since: Wed, 16 May 2018 05:55:38 GMT

服务器端返回资源时,如果头部带上了 last-modified,那么资源下次请求时就会把值加入到请求头 if-modified-since 中,服务器可以对比这个值,确定资源是否发生变化,如果没有发生变化,则返回 304。

4. etag / if-none-match

这也是一组请求/相应头

响应头:

代码语言:javascript复制
etag: "D5FC8B85A045FF720547BC36FC872550"

请求头:

代码语言:javascript复制
if-none-match: "D5FC8B85A045FF720547BC36FC872550"

原理类似,服务器端返回资源时,如果头部带上了 etag,那么资源下次请求时就会把值加入到请求头 if-none-match 中,服务器可以对比这个值,确定资源是否发生变化,如果没有发生变化,则返回 304。

上面四种缓存的优先级:cache-control > expires > etag > last-modified


2.2. 使用动态 polyfill

Polyfill 的特点是非必需和不变,因为对于一台手机来说,需要哪些 polyfill 是固定的,当然也可能完全不需要 polyfill。

现在为了浏览器的兼容性,我们常常引入各种 polyfill,但是在构建时静态地引入 polyfill 存在一些问题,比如对于机型和浏览器版本比较新的用户来说,他们完全不需要 polyfill,引入 polyfill 对于这部分用户来说是多余的,从而造成体积变大和性能损失。

比如 React 16 的代码中依赖了 ES6 的 Map/Set 对象,使用时需要你自己加入 polyfill,但目前几个完备的 Map/Set 的 polyfill 体积都比较大,打包进来会增大很多体积。

还比如 Promise 对象,实际上根据 caniuse.com 的数据,移动端上,中国接近 94% 的用户浏览器,都是原生支持 Promise 的,并不需要 polyfill。但实际上我们打包时还是会打包 Promise 的 polyfill,也就是说,我们为了 6% 的用户兼容性,增大了 94% 用户的加载体积。

所以这里的解决方法就是,去掉构建中静态的 polyfill,换而使用 polyfill.io 这样的动态 polyfill 服务,保证只有在需要时,才会引入 polyfill。

具体的使用方法非常简单,只需要外链一个 js:

代码语言:javascript复制
<script src="https://cdn.polyfill.io/v2/polyfill.min.js"></script>

当然这样是加载全部的 polyfill,实际上你可能并不需要这么多,比如你只需要 Map/Set 的话:

代码语言:javascript复制
<script src="https://cdn.polyfill.io/v2/polyfill.min.js?features=Map,Set"></script>

动态 polyfill 的原理

如果你用最新的 Chrome 浏览器访问这个链接的话:https://cdn.polyfill.io/v2/polyfill.js,你会发现内容几乎是空的:

如果打开控制台,模拟 iOS 的 Safari,再访问一次,你会发现里面就出现了一些 polyfill(URL 对象的 polyfill):

这就是 polyfill.io 的原理,它会根据你的浏览器 UA 头,判断你是否支持某些特性,从而返回给你一个合适的 polyfill。对于最新的 Chrome 浏览器来说,不需要任何 polyfill,所以返回的内容为空。对于 iOS Safari 来说,需要 URL 对象的 polyfill,所以返回了对应的资源。


2.3. 使用 SplitChunksPlugin 自动拆分业务基础库

Webpack 4 抛弃了原有的 CommonChunksPlugin,换成了更为先进的 SplitChunksPlugin,用于提取公用代码。

它们的区别就在于,CommonChunksPlugin 会找到多数模块中都共有的东西,并且把它提取出来(common.js),也就意味着如果你加载了 common.js,那么里面可能会存在一些当前模块不需要的东西。

而 SplitChunksPlugin 采用了完全不同的 heuristics 方法,它会根据模块之间的依赖关系,自动打包出很多很多(而不是单个)通用模块,可以保证加载进来的代码一定是会被依赖到的。

下面是一个简单的例子,假设我们有 4 个 chunk,分别依赖了以下模块:

chunk

依赖模块

chunk-a

react, react-dom, componentA, utils

chunk-b

react, react-dom, componentB, utils

chunk-c

angular, componentC, utils

chunk-d

angular, componentD, utils

如果是以前的 CommonChunksPlugin,那么默认配置会把它们打包成下面这样:

包名

包含的模块

common

utils

chunk-a

react, react-dom, componentA

chunk-b

react, react-dom, componentB

chunk-c

angular, componentC

chunk-d

angular, componentD

显然在这里,react、react-dom、angular 这些公用的模块没有被抽出成为独立的包,存在进一步优化的空间。

现在,新的 SplitChunksPlugin 会把它们打包成以下几个包:

包名

包含的模块

chunk-a~chunk-b~chunk-c~chunk-d

utils

chunk-a~chunk-b

react, react-dom

chunk-c~chunk-d

angular

chunk-a

componentA

chunk-b

componentB

chunk-c

componentC

chunk-d

componentD

这就保证了所有公用的模块,都会被抽出成为独立的包,几乎完全避免了多页应用中,重复加载相同模块的问题。

具体如何配置 SplitChunksPlugin,请参考 webpack 官方文档。

注:目前使用 SplitChunksPlugin 存在的坑

虽然 webpack 4.0 提供的 SplitChunksPlugin 非常好用,但截止到写这篇文章的时候(2018年5月),依然存在一个坑,那就是 html-webpack-plugin 还不完全支持 SplitChunksPlugin,生成的公用模块包还无法自动注入到 html 中。

可以参考下面的 issue 或者 PR:

  • How to inject webpack 4 splited chunks. · Issue #882
  • allow to specify regexp as included or excluded chunks by mike1808 · Pull Request #881

2.4. 正确使用 Tree Shaking 减少业务代码体积

Tree Shaking 这已经是一个很久很久以前就存在的 webpack 特性了,老生常谈,但事实上不是所有的人(特别是对 webpack 不了解的人)都正确地使用了它,所以我今天要在这里啰嗦地再写一遍。

例如,我们有下面这样一个使用了 ES Module 标准的模块:

代码语言:javascript复制
// math.js
export function square(x) {
  return x * x
}
  
export function cube(x) {
  return x * x * x
}

然后你在另一个模块中引用了它:

代码语言:javascript复制
// index.js
import { cube } from './math'
cube(123)

经过 webpack 打包之后,math.js 会变成下面这样:

代码语言:javascript复制
/* 1 */
/***/ (function(module, __webpack_exports__, __webpack_require__) {

"use strict";
/* unused harmony export square */
/* harmony export (immutable) */ __webpack_exports__["a"] = cube;
function square(x) {
  return x * x;
}
  
function cube(x) {
  return x * x * x;
}

注意这里 square 函数依然存在,但多了一行 magic comment:unused harmony export square

随后的压缩代码的 uglifyJS 就会识别到这行 magic comment,并且把 square 函数丢弃。

但是一定要注意: webpack 2.0 开始原生支持 ES Module,也就是说不需要 babel 把 ES Module 转换成曾经的 commonjs 模块了,想用上 Tree Shaking,请务必关闭 babel 默认的模块转义:

代码语言:javascript复制
{
  "presets": [
    ["env", {
      "modules": false
      }
    }]
  ]
}

另外,Webpack 4.0 开始,Tree Shaking 对于那些无副作用的模块也会生效了。

如果你的一个模块在 package.json 中说明了这个模块没有副作用(也就是说执行其中的代码不会对环境有任何影响,例如只是声明了一些函数和常量):

代码语言:javascript复制
{
  "name": "your-module",
  "sideEffects": false
}

那么在引入这个模块,却没有使用它时,webpack 会自动把它 Tree Shaking 丢掉:

代码语言:javascript复制
import yourModule from 'your-module'
// 下面没有用到 yourModule

这一点对于 lodash、underscore 这样的工具库来说尤其重要,开启了这个特性之后,你现在可以无心理负担地这样写了:

代码语言:javascript复制
import { capitalize } from 'lodash-es';
document.write(capitalize('yo'));

希望这篇文章,能拯救你下半年的 KPI :)


P.S.还有文章的下半部分,周五再跟大家见面哟~

如果文章觉得不错,动动小手分享给小伙伴吧

------------------------------------------------------------------------

原文作者:腾讯工程师王伟嘉。

来源:腾讯内部KM论坛。

想玩转React?

想让下半年的KPI蹭蹭蹭的往上涨?

React实践宝典等你来撩~

前端NEXT学院-React课程火热招生中!

  感兴趣的同学赶紧点击原文了解详情吧~

腾讯NEXT学位

求职干货 | 前辈blog  | 前端课程

0 人点赞