# 项目中node_modules里面的那些无用包
相信大家在开发过程中执行yarn
或者npm i
的时候都会发现一个问题, 明明我的项目只依赖几个npm
包, 但是执行完命令后node_modules
里面却多出了超级多没见过的无用包?这就和依赖的处理方式有关了, 今天我们就来聊聊这部分的内容.
# npm2的依赖管理
npm2
安装依赖的时候比较简单直接, 直接按照包依赖的树形结构下载填充本地目录结构.
比如在项目中 A
和 C
都依赖 B
, 无论被依赖的 B
是否是同一个版本, 都会直接无脑的生成对应的树结构, 比如我们现在有下面的依赖:
A@2.0.0: BaseA@1.0.0 BaseB@2.0.0
B@3.0.0: BaseA@1.0.0 BaseB@2.0.1
那么 npm i
之后 node_modules
里面生成的内容将是下面这样的
这样的结构非常直观, 但是有一个问题就是, 如果项目的依赖过多的话, 可能导致下面这些问题:
生成的依赖嵌套非常深
相同版本的依赖大量冗余
# npm3/yarn的依赖管理
npm3
对于 npm2
的情况进行了优化, 那么如何进行优化呢?其实我们最直观的思路就是将树打平, 将依赖扁平化, 不就能解决嵌套过深和依赖冗余的问题.所以, 在上面的例子中, 如果我们用 npm3
来进行 install
, 最后生成的 node_modules
会是这样的结构:
这样看起来是不是就好多了, 但是此时会有什么问题呢?我们实操一下试试看.在项目中安装 A
和 B
可以看到我们项目本身的依赖文件里面只有 a_klx
和 b_klx
, 但是执行完 npm i
命令后却发现多了几个我们没有引入的包 a_base_klx
和 b_base_klx
.
其实这是由 a_klx
和 b_klx
本身自己引入的 npm
包, 但是却出现在了我们的 node_modules
下.那么如果我们直接使用这两个包会有什么反应呢?
可以看到, 我们是可以正常使用这两个我们并未声明在依赖中的 npm
包的, 因为这两个包存在于我们项目的 node_modules
下, 根据 npm
包的查找规则, 我们是可以找到这两个包的.所以这种依赖关系就导致了下面两个问题:
我们项目本身的
node_modules
结构不够直观依赖不安全, 我们可以使用依赖文件中并没有声明的
npm
包
其实第一点的问题并不是很大, 主要是第二点可能会导致一些奇怪的问题.以我们之前的例子来说, 我们可以直接在项目里面直接使用 a_base_klx
, 因为 node_modules
里面这两个包实际上是存在的, 但是他们又不是永远存在的.万一有一天, a_klx
和 b_klx
里都去除了这两个基础包的引用, node_modules
里面将不再存在 a_base_klx
和 b_base_klx
, 那么我们的代码就会出现问题...也就是:
DANGER
我的代码啥也没动, 放了一个晚上就坏了
同时, 我们对于这种处理方式其实很容易有一个疑问, 如果我同时引用了同一个包的多个不同版本, 会帮我把哪个包提出来, 同时我每次 npm i
之后提出来的包版本都是一样的吗?会不会存在这次是 2.0.0
版本下次是 2.0.1
版本的情况, 比如我们下面这种情况:
A@1.0.0: BaseA@1.0.0 BaseB@2.0.0
B@1.0.0: BaseA@1.0.0 BaseB@2.0.1
D@1.0.0: BaseA@1.0.0 BaseB@2.0.1
生成的依赖是下面这样的:
还是下面这样的:
其实看起来后面这个更合理, 因为有两个包用到了 2.0.1
版本, 将它提出来更好, 我们实际操作一下试试:
被提到最外层的包是 2.0.0
版本的, 然后 b_klx
和 d_klx
的 node_modules
下面各自有一个 b_base_klx@2.0.1
这一块的内容自己查了一下, 大部分说法是会根据 package.json
里面的顺序决定谁会被提出来, 放在前面的包依赖的内容会被先提出来.
不过自己实操了一下发现并不是这样, 即使我把 b_klx
或者 d_klx
移到最前面, 被提出来的包依然是 a_klx
依赖的 2.0.0
版本, 随后自己翻了一下 npm
的源码, 发现内部其实会对拿到的依赖列表进行一些处理
最终会通过
localeCompare
方法对依赖进行一次排序, 所以字典序在前面的 npm
包的底层依赖会被优先提出来, 对于我们的例子来说就是 a_klx
所依赖的 b_base_klx@2.0.0
会被优先提出来.
# pnpm的依赖管理
pnpm
为了解决上述这些问题, 采用了一种不同于 npm/yarn
的依赖管理方式.
如果我们用 pnpm
再来安装一遍上面的依赖, 会发现项目的 node_modules
文件夹只有当前 package.json
中所声明的各个依赖(的软连接), 而真正的模块文件, 存在于 node_modules/.pnpm
, 由 模块名@版本号
形式的文件夹扁平化存储(解决依赖重复安装).同时这样设计, 也很好的避免了之前可以访问非法 npm
包的问题, 因为当前项目的 node_modules
只有我们声明过的依赖, 这也让 node_modules
里面的文件看起来非常的直观.
同时, node_modules/.pnpm
中存储的文件其实是 pnpm
实际缓存文件的 硬链接 , 从而避免了多个项目带来多份相同文件引起的空间浪费问题.
但是从 pnpm
的 官网 (opens new window) 来看, 其实它默认会使用 copy-on-write
的方式来进行处理, 也就是如果你尝试对内容进行修改的话, 会复制一份文件而不会影响到源文件.
然后它不生效的原因似乎是因为 libuv
的 bug (opens new window). 所以在 copy-on-write
不生效的情况下被回退到了 hardlink
的方式去处理.
← 跨端杂谈 chrome devtools →