Webpack 原理——如何实现代码打包

想要知道 Webpack 打包原理的我们需要提前知道两个知识点

1、什么是 require？

说到 require 首先想到的可能就是 import，import 是 es6 的一个语法标准,

– require 是运行时调用，因此 require 理论上可以运用在代码的任何地方；

– import 是编译时调用，因此必须放在文件开头；

在我们使用 Webpack 进行编译的时候会使用 babel 把 import 转译成 require，在 CommonJS 中，有一个全局性方法 require()，用于加载模块, AMD、CMD 也采用的 require 方式来引用。

例如：

var add = require('./a.js');
add(1,2)

简单看来 require 其实就是一个函数，引用的 ./a.js 只是函数的一个参数。

2、什么是 exports？

在这里我们可以认为 exports 是一个对象，MDN export 可以看下具体用法。

了解了require 和 exports，接下来我们就可以开始打包

我们先看看下面我们打包后的代码结构，我们可以发现经过打包后会出现 require 和 exports。

并不是所有的浏览器都能执行 require exports，必须自己去实现一下 require 和 exports 才能保证代码的正常运行。打包后的代码就是一个自执行函数，参数有依赖信息，以及文件的 code，执行的函数体通过 eval 执行 code。

总体设计图如下：

第一步：编写我们的配置文件

配置文件中配置了我们打包的入口 entry 以及打包后的出口 output 为后面的生成文件做好准备。

const path = require("path");
module.exports = {
    entry: "./src/index.js",
    output: {
        path: path.resolve(__dirname, "./dist"),//打包后输出的文件地址，需要绝对路径因此需要path
        filename:"main.js"
    },
    mode:"development"
}

第二步：模块分析

整体思路：可以总结来说就是利用 fs 文件读取入口文件通过 AST 获取到 import 依赖的文件的路径，如果依赖文件依然有依赖一直递归下去直至依赖分析清楚，维护在一个 map 里面。

细节拆解：有人会有疑惑为什么用 AST 因为 AST 天生有这个功能，它的 ImportDeclaration 能帮我们快速过滤出 import 语法，当然用正则匹配也是可以的，毕竟文件读取完就是一个字符串，通过编写牛逼的正则获取文件依赖路径，但是不够 elegant。

step1：新建 index.js，a.js，b.js 依赖关系如下

index.js文件

import { str } from "./a.js";
console.log(`${str} Webpack`)

a.js文件

import { b} from "./b.js"
export const str = "hello"

b.js 文件

export const b="bbb"

step2：编写 Webpack

模块分析：利用 AST 的 @babel/parser 将文件读取的字符串转换成 AST 树，@babel/traverse 进行语法分析，利用 ImportDeclaration 过滤出 import 找出文件依赖。

const content = fs.readFileSync(entryFile, "utf-8");
const ast = parser.parse(content, { sourceType: "module" });
const dirname = path.dirname(entryFile);
const dependents = {};
traverse(ast, {
    ImportDeclaration({ node }) {
    // 过滤出import
    const newPathName = "./" + path.join(dirname,node.source.value);
    dependents[node.source.value] = newPathName;
    }
})
const { code } = transformFromAst(ast, null, {
presets: ["@babel/preset-env"]
})
return {
    entryFile,
    dependents,
    code
}

结果如下：

利用递归或是循环逐个 import 文件进行依赖分析，这块注意，我们是使用 for 循环实现了分析所有依赖，之所以循环可以分析所有依赖，注意 modules 的长度是变化的，当有依赖的时候 .modules.push 新的依赖，modules.length 就会变化。

for (let i = 0; i < this.modules.length; i++) {
    const item = this.modules[i];
    const { dependents } = item;
    if (dependents) {
        for (let j in dependents) {
            this.modules.push(this.parse(dependents[j]));
        }
    }
}

第三步：编写 WebpackBootstrap 函数+生成输出文件

编写 WebpackBootstrap 函数：这里我们需要做的首先是 WebpackBootstrap 函数，编译后我们源代码的 import 会被解析成 require 浏览器既然不认识 require ，那我们就先声明它，毕竟 require 就是一个方法，在编写函数的时候还需要注意的是作用域隔离，防止变量污染。我们代码中 exports 也需要我们声明一下，保证代码在执行的时候 exports 已经存在。

生成输出文件：生成文件的地址我们在配置文件已经写好了，再用 fs.writeFileSync 写入到输出文件夹即可。

file(code) {
    const filePath = path.join(this.output.path, this.output.filename)
    const newCode = JSON.stringify(code);
    // 生成bundle文件内容
    const bundle = `(function(modules){
      function require(module){
        function pathRequire(relativePath){
          return require(modules[module].dependents[relativePath])
        }
        const exports={};
        (function(require,exports,code){
          eval(code)
        })(pathRequire,exports,modules[module].code);
        return exports
      }
      require('${this.entry}')
    })(${newCode})`;
      //  WebpackBoostrap
    // 生成文件。放入dist 目录
    fs.writeFileSync(filePath,bundle,'utf-8')
  }

第四步：分析执行顺序

我们可以在浏览器的控制台运行一下打包后的结果，如果能正常应该会打印出 hello Webpack。

总结

通过以上的分析，我们应该对 Webpack 的大概流程有基本的了解，利用 AST 去解析代码只是本次演示的一种方式，不是 Webpack 的真实实现，Webpack 他自己有自己的 AST 解析方式，万变不离其宗都是拿到模块依赖，Webpack 生态是很完整，有兴趣的童鞋可以考虑以下三个问题：

如果出现组件循环引用那又应该如何处理？
Webpack 是如何加载 loader 的？
犹大大极力推荐的 vite 可以实现按需打包，大大降低开发时候打包速度，如果是 webapck 又是应该如何实现？

转自https://zoo.team/article/webpack-reason

posted @ 2021-11-22 11:01 苍青浪阅读(508) 评论(0) 收藏举报

刷新页面返回顶部

苍青浪