1、js 模块化历程这是一篇关于 js 模块化历程的长长的流水账,记录 js 模块化思想的诞生与变迁,展望 ES6 模块化标准的未来。经历过这段历史的人或许会感到沧桑,没经历过的人也应该知道这段历史。无模块时代在 ajax 还未提出之前, js 还只是一种“玩具语言”,由 Brendan Eich 花了不到十天时间发明,用来在网页上进行表单校验、实现简单的动画效果等等,你可以回想一下那个网页上到处有公告块飘来飘去的时代。这个时候并没有前端工程师,服务端工程师只需在页面上随便写写 js 就能搞定需求。那个时候的前端代码大概像这样:if(xx)/.else/xxxxxxxxxxxfor(var i=0
2、; i顺序不能错,也不能漏写某个。在多人开发的时候很难协调。萌芽时代的解决方案:1.用自执行函数来包装代码2.modA = function()var a,b; /变量 a、b 外部不可见return add : function(c)a + b + c;,format: function()/()这样 function 内部的变量就对全局隐藏了,达到是封装的目的。但是这样还是有缺陷的,modA 这个变量还是暴漏到全局了,随着模块的增多,全局变量还是会越来越多。2. java 风格的命名空间为了避免全局变量造成的冲突,人们想到或许可以用多级命名空间来进行管理,于是,代码就变成了这个风格:app
3、.util.modA = xxx;app.tools.modA = xxx;app.tools.modA.format = xxx;Yahoo 的 YUI 早期就是这么做的,调用的时候不得不这么写:app.tools.modA.format();这样调用函数,写写都会觉得恶心,所以这种方式并没有被很多人采用,YUI后来也不用这种方式了。3. jQuery 风格的匿名自执行函数(function(window)/代码window.jQuery = window.$ = jQuery;/通过给 window 添加属性而暴漏到全局)(window);jQuery 的封装风格曾经被很多框架模仿,通过匿
4、名函数包装代码,所依赖的外部变量传给这个函数,在函数内部可以使用这些依赖,然后在函数的最后把模块自身暴漏给 window。如果需要添加扩展,则可以作为 jQuery 的插件,把它挂载到$上。这种风格虽然灵活了些,但并未解决根本问题:所需依赖还是得外部提前提供、还是增加了全局变量。模块化面临什么问题从以上的尝试中,可以归纳出 js 模块化需要解决那些问题:1. 如何安全的包装一个模块的代码?(不污染模块外的任何代码)2. 如何唯一标识一个模块?3. 如何优雅的把模块的 API 暴漏出去?(不能增加全局变量)4. 如何方便的使用所依赖的模块?围绕着这些问题,js 模块化开始了一段艰苦而曲折的征途。
5、源自 nodejs 的规范 CommonJs2009 年,nodejs 横空出世,开创了一个新纪元,人们可以用 js 来编写服务端的代码了。如果说浏览器端的 js 即便没有模块化也可以忍的话,那服务端是万万不能的。大牛云集的 CommonJs 社区发力,制定了Modules/1.0(http:/monjs.org/wiki/Modules/1.0)规范,首次定义了一个模块应该长啥样。具体来说,Modules/1.0 规范包含以下内容:1. 模块的标识应遵循的规则(书写规范)2. 定义全局函数 require,通过传入模块标识来引入其他模块,执行的结果即为别的模块暴漏出来的 API3. 如果被
6、require 函数引入的模块中也包含依赖,那么依次加载这些依赖4. 如果引入模块失败,那么 require 函数应该报一个异常5. 模块通过变量 exports 来向往暴漏 API,exports 只能是一个对象,暴漏的 API须作为此对象的属性。此规范一出,立刻产生了良好的效果,由于其简单而直接,在 nodejs 中,这种模块化方案立刻被推广开了。遵循 commonjs 规范的代码看起来是这样的:(来自官方的例子)/math.jsexports.add = function() var sum = 0, i = 0, args = arguments, l = args.length;wh
7、ile (i 标签的形式来加载资源的(ajax 方式不行,有跨域问题),没办法让代码同步执行,所以像 commonjs 那样的写法会直接报错。所以,社区意识到,要想在浏览器环境中也能模块化,需要对规范进行升级。顺便说一句,CommonJs 原来是叫 ServerJs,从名字可以看出是专攻服务端的,为了统一前后端而改名 CommonJs。(论起名的重要性 )而就在社区讨论制定下一版规范的时候,内部发生了比较大的分歧,分裂出了三个主张,渐渐的形成三个不同的派别:1.Modules/1.x 派2.这一波人认为,在现有基础上进行改进即可满足浏览器端的需要,既然浏览器端需要 function 包装,需要
8、异步加载,那么新增一个方案,能把现有模块转化为适合浏览器端的就行了,有点像“保皇派” 。基于这个主张,制定了Modules/Transport(http:/monjs.org/wiki/Modules/Transport)规范,提出了先通过工具把现有模块转化为复合浏览器上使用的模块,然后再使用的方案。browserify 就是这样一个工具,可以把 nodejs 的模块编译成浏览器可用的模块。(Modules/Transport 规范晦涩难懂,我也不确定 browserify 跟它是何关联,有知道的朋友可以讲一下)目前的最新版是 Modules/1.1.1(http:/monjs.org/wik
9、i/Modules/1.1.1),增加了一些 require 的属性,以及模块内增加 module 变量来描述模块信息,变动不大。2. Modules/Async 派这一波人有点像“ 革新派”,他们认为浏览器与服务器环境差别太大,不能沿用旧的模块标准。既然浏览器必须异步加载代码,那么模块在定义的时候就必须指明所依赖的模块,然后把本模块的代码写在回调函数里。模块的加载也是通过下载-回调这样的过程来进行,这个思想就是 AMD 的基础,由于“革新派”与“保皇派”的思想无法达成一致,最终从 CommonJs 中分裂了出去,独立制定了浏览器端的 js 模块化规范 AMD(Asynchronous Mod
10、ule Definition)(https:/ AMD 规范的内容。3. Modules/2.0 派这一波人有点像“ 中间派”,既不想丢掉旧的规范,也不想像 AMD 那样推到重来。他们认为,Modules/1.0 固然不适合浏览器,但它里面的一些理念还是很好的,(如通过 require 来声明依赖),新的规范应该兼容这些,AMD 规范也有它好的地方(例如模块的预先加载以及通过 return 可以暴漏任意类型的数据,而不是像 commonjs 那样 exports 只能为 object),也应采纳。最终他们制定了一个Modules/Wrappings(http:/monjs.org/wiki/M
11、odules/Wrappings)规范,此规范指出了一个模块应该如何“包装” ,包含以下内容:1. 全局有一个 module 变量,用来定义模块2. 通过 module.declare 方法来定义一个模块3. module.declare 方法只接收一个参数,那就是模块的factory,次 factory 可以是函数也可以是对象,如果是对象,那么模块输出就是此对象。4. 模块的 factory 函数传入三个参数:require,exports,module,用来引入其他依赖和导出本模块 API5. 如果 factory 函数最后明确写有 return 数据(js 函数中不写return 默认返
12、回 undefined),那么 return 的内容即为模块的输出。使用该规范的例子看起来像这样:/可以使用 exprots 来对外暴漏 APImodule.declare(function(require, exports, module)exports.foo = “bar“;);/也可以直接 return 来对外暴漏数据module.declare(function(require)return foo: “bar“ ;);AMD/RequireJs 的崛起与妥协AMD 的思想正如其名,异步加载所需的模块,然后在回调函数中执行主逻辑。这正是我们在浏览器端开发所习惯了的方式,其作者亲自实现
13、了符合 AMD 规范的 requirejs,AMD/RequireJs 迅速被广大开发者所接受。AMD 规范包含以下内容:1. 用全局函数 define 来定义模块,用法为:define(id?, dependencies?, factory);2. id 为模块标识,遵从 CommonJS Module Identifiers 规范3. dependencies 为依赖的模块数组,在 factory 中需传入形参与之一一对应4. 如果 dependencies 的值中有”require”、”exports”或”module”,则与 commonjs 中的实现保持一致5. 如果 depende
14、ncies 省略不写,则默认为“require“, “exports“, “module“,factory 中也会默认传入require,exports,module6. 如果 factory 为函数,模块对外暴漏 API 的方法有三种:return 任意类型的数据、exports.xxx=xxx、module.exports=xxx7. 如果 factory 为对象,则该对象即为模块的返回值基于以上几点基本规范,我们便可以用这样的方式来进行模块化组织代码了:/a.jsdefine(function()console.log(a.js 执行);return hello: function()c
15、onsole.log(hello, a.js););/b.jsdefine(function()console.log(b.js 执行);return hello: function()console.log(hello, b.js););/main.jsrequire(a, b, function(a, b)console.log(main.js 执行);a.hello();$(#b).click(function()b.hello(););)上面的 main.js 被执行的时候,会有如下的输出:a.js 执行b.js 执行main.js 执行hello, a.js在点击按钮后,会输出:he
16、llo, b.js这结局,如你所愿吗?大体来看,是没什么问题的,因为你要的两个 hello 方法都正确的执行了。但是如果细细来看,b.js 被预先加载并且预先执行了,(第二行输出),b.hello这个方法是在点击了按钮之后才会执行,如果用户压根就没点,那么 b.js 中的代码应不应该执行呢?这其实也是 AMD/RequireJs 被吐槽的一点,预先下载没什么争议,由于浏览器的环境特点,被依赖的模块肯定要预先下载的。问题在于,是否需要预先执行?如果一个模块依赖了十个其他模块,那么在本模块的代码执行之前,要先把其他十个模块的代码都执行一遍,不管这些模块是不是马上会被用到。这个性能消耗是不容忽视的。
17、另一点被吐槽的是,在定义模块的时候,要把所有依赖模块都罗列一遍,而且还要在 factory 中作为形参传进去,要写两遍很大一串模块名称,像这样:define(a, b, c, d, e, f, g, function(a, b, c, d, e, f, g) . )编码过程略有不爽。好的一点是,AMD 保留了 commonjs 中的 require、exprots 、module 这三个功能(上面提到的第 4 条)。你也可以不把依赖罗列在 dependencies 数组中。而是在代码中用 require 来引入,如下:define(function()console.log(main2.js
18、执行);require(a, function(a)a.hello(); );$(#b).click(function()require(b, function(b)b.hello(););););我们在 define 的参数中未写明依赖,那么 main2.js 在执行的时候,就不会预先加载 a.js 和 b.js,只是执行到 require 语句的时候才会去加载,上述代码的输出如下:main2.js 执行a.js 执行hello, a.js可以看到 b.js 并未执行,从网络请求中看, b.js 也并未被下载。只有在按钮被点击的时候 b.js 才会被下载执行,并且在回调函数中执行模块中的方法
19、。这就是名副其实的“ 懒加载” 了。这样的懒加载无疑会大大减轻初始化时的损耗(下载和执行都被省去了),但是弊端也是显而易见的,在后续执行 a.hello 和 b.hello 时,必须得实时下载代码然后在回调中才能执行,这样的用户体验是不好的,用户的操作会有明显的延迟卡顿。但这样的现实并非是无法接受的,毕竟是浏览器环境,我们已经习惯了操作网页时伴随的各种 loading。但是话说过来,有没有更好的方法来处理问题呢?资源的下载阶段还是预先进行,资源执行阶段后置,等到需要的时候再执行。这样一种折衷的方式,能够融合前面两种方式的优点,而又回避了缺点。这就是 Modules/Wrappings 规范,还
20、记得前面提到的“中间派”吗?在 AMD 的阵营中,也有一部分人提出这样的观点,代码里写一堆回调实在是太恶心了,他们更喜欢这样来使用模块:var a = require(a);a.hello();$(#b).click(function()var b = require(b);b.hello(););于是,AMD 也终于决定作妥协,兼容 Modules/Wrappings 的写法,但只是部分兼容,例如并没有使用 module.declare 来定义模块,而还是用 define,模块的执行时机也没有改变,依旧是预先执行。因此,AMD 将此兼容称为 Simplified CommonJS wrapp
21、ing,即并不是完整的实现 Modules/Wrappings。作了此兼容后,使用 requirejs 就可以这么写代码了:/d.jsdefine(function(require, exports, module)console.log(d.js 执行);return helloA: function()var a = require(a);a.hello();,run: function()$(#b).click(function()var b = require(b);b.hello();););注意定义模块时候的轻微差异,dependencies 数组为空,但是 factory 函数的
22、形参必须手工写上 require,exports,module,(这不同于之前的 dependencies 和factory 形参全不写),这样写即可使用 Simplified CommonJS wrapping 风格,与commonjs 的格式一致了。虽然使用上看起来简单,然而在理解上却给后人埋下了一个大坑。因为 AMD 只是支持了这样的语法,而并没有真正实现模块的延后执行。什么意思呢?上面的代码,正常来讲应该是预先下载 a.js 和 b.js,然后在执行模块的 helloA 方法的时候开始执行 a.js 里面的代码,在点击按钮的时候开始执行 b.js 中的方法。实际却不是这样,只要此模块被
23、别的模块引入,a.js 和 b.js 中的代码还是被预先执行了。我们把上面的代码命名为 d.js,在别的地方使用它:require(d, function(d);上面的代码会输出a.js 执行b.js 执行d.js 执行可以看出,尽管还未调用 d 模块的 API,里面所依赖的 a.js 和 b.js 中的代码已经执行了。AMD 的这种只实现语法却未真正实现功能的做法容易给人造成理解上的困难,被强烈吐槽。(在 requirejs2.0 中,作者声明已经处理了此问题(https:/ 2.1.20 版测试的时候还是会预先执行,我有点不太明白原因,如果有懂的高手请指教)兼容并包的 CMD/seajs既
24、然 requirejs 有上述种种不甚优雅的地方,所以必然会有新东西来完善它,这就是后起之秀 seajs,seajs 的作者是国内大牛淘宝前端步道者玉伯。 seajs 全面拥抱 Modules/Wrappings 规范,不用 requirejs 那样回调的方式来编写模块。而它也不是完全按照 Modules/Wrappings 规范,seajs 并没有使用 declare 来定义模块,而是使用和 requirejs 一样的 define,或许作者本人更喜欢这个名字吧。(然而这或多或少又会给人们造成理解上的混淆),用 seajs 定义模块的写法如下:/a.jsdefine(function(req
25、uire, exports, module)console.log(a.js 执行);return hello: function()console.log(hello, a.js););/b.jsdefine(function(require, exports, module)console.log(b.js 执行);return hello: function()console.log(hello, b.js););/main.jsdefine(function(require, exports, module)console.log(main.js 执行);var a = require
26、(a);a.hello(); $(#b).click(function()var b = require(b);b.hello();););定义模块时无需罗列依赖数组,在 factory 函数中需传入形参require,exports,module,然后它会调用 factory 函数的 toString 方法,对函数的内容进行正则匹配,通过匹配到的 require 语句来分析依赖,这样就真正实现了commonjs 风格的代码。上面的 main.js 执行会输出如下:main.js 执行a.js 执行hello, a.jsa.js 和 b.js 都会预先下载,但是 b.js 中的代码却没有执行,
27、因为还没有点击按钮。当点击按钮的时候,会输出如下:b.js 执行hello, b.js可以看到 b.js 中的代码此时才执行。这样就真正实现了“就近书写,延迟执行“,不可谓不优雅。如果你一定要挑出一点不爽的话,那就是 b.js 的预先下载了。你可能不太想一开始就下载好所有的资源,希望像 requirejs 那样,等点击按钮的时候再开始下载 b.js。本着兼容并包的思想,seajs 也实现了这一功能,提供 require.async API,在点击按钮的时候,只需这样写:var b = require.async(b);b.hello();b.js 就不会在一开始的时候就加载了。这个 API 可
28、以说是简单漂亮。关于模块对外暴漏 API 的方式,seajs 也是融合了各家之长,支持 commonjs 的exports.xxx = xxx 和 module.exports = xxx 的写法,也支持 AMD 的 return 写法,暴露的 API 可以是任意类型。你可能会觉得 seajs 无非就是一个抄,把别人家的优点都抄过来组合了一下。其实不然,seajs 是 commonjs 规范在浏览器端的践行者,对于 requirejs 的优点也加以吸收。看人家的名字,就是海纳百川之意。(再论起名的重要性),既然它的思想是海纳百川,讨论是不是抄就没意义了。鉴于 seajs 融合了太多的东西,已经
29、无法说它遵循哪个规范了,所以玉伯干脆就自立门户,起名曰 CMD(Common Module Definition)规范,有了纲领,就不会再存在非议了。面向未来的 ES6 模块标准既然模块化开发的呼声这么高,作为官方的 ECMA 必然要有所行动,js 模块很早就列入草案,终于在 2015 年 6 月份发布了 ES6 正式版。然而,可能由于所涉及的技术还未成熟,ES6 移除了关于模块如何加载 /执行的内容,只保留了定义、引入模块的语法。所以说现在的 ES6 Module 还只是个雏形,半成品都算不上。但是这并不妨碍我们先窥探一下 ES6 模块标准。定义一个模块不需要专门的工作,因为一个模块的作用就
30、是对外提供 API,所以只需用 exoprt 导出就可以了:/方式一, a.jsexport var a = 1;export var obj = name: abc, age: 20;export function run()/方式二, b.jsvar a = 1;var obj = name: abc, age: 20;function run()export a, obj, run使用模块的时候用 import 关键字,如:import run as go from arun()如果想要使用模块中的全部 API,也可以不必把每个都列一遍,使用 module 关键字可以全部引入,用法:mo
31、dule foo from aconsole.log(foo.obj);a.run();在花括号中指明需使用的 API,并且可以用 as 指定别名。ES6 Module 的基本用法就是这样,可以看到确实是有些薄弱,而且目前还没有浏览器能支持,只能说它是面向未来了。目前我们可以使用一些第三方模块来对 ES6 进行编译,转化为可以使用的 ES5代码,或者是符合 AMD 规范的模块,例如 ES6 module transpiler。另外有一个项目也提供了加载 ES6 模块的方法,es6-module-loader(https:/ ES7 一发布,模块的加载有了标准,浏览器给与了实现,这些工具也就没有用武之地了。未来还是很值得期待的,从语言的标准上支持模块化,js 就可以更加自信的走进大规模企业级开发。=参考资料:https:/