将 node_modules 目录放入 Git 仓库的优点
ztj100 2025-03-24 01:40 19 浏览 0 评论
推荐一篇文章 Why you should check-in your node dependencies[1]
作者是Google 的一位工程师,他介绍了他们团队将 Node.js 项目的 node_modules 目录加入到Git仓库的好处,值得借鉴。除了 Node.js 项目,像 PHP 项目的 vendor 目录,也可以考虑下这样做。
下面是原文:
在我现在的工作之前,我在每个公司的每个团队都有一个约定:不要将你的 node_modules 文件夹放到你的版本控制系统(在本文的其余部分我将其称为 "Git"...)中。这似乎是一个可靠的建议,有多个原因。
onode_modules 中的代码并不是由团队直接编写的。
onode_modules 中的代码通常相当大,会在 git diffs 和 pull requests 操作时引入很多不必要的代码,将代码审核变得复杂。
onode_modules 中的代码可以很容易地通过 npm install 来获得。
我目前在谷歌的Chrome DevTools团队工作,我们将 node_modules 文件夹放入了 Git 中。起初,这让我觉得很诧异,但我逐渐发现,这样做有很多的的好处。
优点
不需要npm安装
一旦你将 node_modules 文件夹放入了 Git 中, 你在运行代码之前就不需要运行安装步骤。这不仅对本地开发人员有用,对你在持续集成平台上运行的任何机器人(例如CircleCI、GitHub Actions等)也有很大的加速作用。这是机器人构建完全可以忽略的一步。我在本地从头开始运行一个完整的 npm install 至少需要1-2分钟,而在机器人构建时,这可能需要花费更长的时间。如果你设置机器人在在每次 pull request 时都运行,机器人可能每天都会运行50次以上。将node_modules 文件夹放入了 Git 中可以节省大量的时间(和带宽!)。
代码一致、构建更加有保证
将node_modules 文件夹放入了 Git 中可以保证两个运行代码的开发者运行的是完全相同的代码和完全相同的依赖关系集。虽然,这可以通过 package-lock.json 文件或其他工具来管理,虽然这些工具都很少出现问题,但有时会出现一个小版本号的变化而导致的问题。一旦依赖项位于git中,您就不可能使用除这些依赖项之外的任何其他内容运行,每个开发人员都将运行完全相同的代码库。
可以更好地了解你的代码
当 git diff 向我显示正在添加到项目中的全部代码时,我惊讶地发现我对添加依赖关系有了更清楚的认识。这使我们对依赖关系包做出了贡献,以帮助减少它们在磁盘上的文件大小,并更好地了解依赖对我们的包大小的影响。
更多的去考虑添加一个依赖库的利弊
我在前面提到,人们把 git diff 中显示的大量的依赖库的代码看作是在版本控制中添加依赖关系的一个缺点,我也承认这可能是这种方法的一个缺点,但我发现展示依赖库的代码也是有好处的。添加一个额外的依赖项是因为我不想自己编写几行代码,这是我过去经常做的事情。但现在我考虑得更多,因为我可以看到正在增加的代码,并且可以反思这是否值得。
注意:这并不意味着我们不要用第三方依赖关系!有些时候,增加一个依赖关系是值得的。但在版本控制中看到增加的代码使我对这样做有更多的考虑--成本不再是不可见的的。
大的差异也是可以被管理的
不能回避这样一个事实,即如果一个开发人员在修改中增加了一个新的依赖关系,在差异中可能会有很多代码。我们检查的一个依赖项是 TypeScript,每次我们更新时,git diff 都很庞大,坦率地说这不值得看(除了CHANGELOG)。我们想出了一个规则来帮助我们:一个更新 node_modules 的改动不能触及代码库中的任何其他代码。因此,如果我用最新的版本更新 node_modules/typescript ,如果node_modules之外的任何其他文件夹被改变,我就会被我们的工具警告。
这条规则在大多数时候对我们很有用,因为任何依赖于新的或更新的依赖关系的工作都可以分成两个步骤:
o更新依赖关系
o在代码中使用该依赖关系
有些时候这并不奏效;更新 TypeScript 可能需要我们更新一些代码来修复新版TypeScript 与当前代码不兼容的一些错误。在这种情况下,我们就不需要遵守该规则。
就像软件工程中的任何事情一样,大多数 "规则 "都是指导方针,我们能够在需要时绕过它们。
防止另一个 left-pad 事件
臭名昭著的 left-pad 事件,即一个流行的npm包突然从版本库中删除,导致各地的构建中断,这不会影响到一个将所有的依赖关系都添加到 git 仓库中的团队。虽然他们仍然需要处理 "我们该如何处理这个不受支持的依赖" 的长期影响,但在短期内,他们的构建不会中断,也不会影响他们发布新功能。
总结
如果我创建一个新的代码库,或者加入一个刚刚开始第一个版本的小公司,我会强烈主张将 node_modules 加入到版本控制中。虽然这需要一些时间来适应,但根据我过去两年的工作经验,我上面列出的好处远远超过了这样做的缺点。
引用链接
[1] Why you should check-in your node dependencies: https://www.jackfranklin.co.uk/blog/check-in-your-node-dependencies/
相关推荐
- 其实TensorFlow真的很水无非就这30篇熬夜练
-
好的!以下是TensorFlow需要掌握的核心内容,用列表形式呈现,简洁清晰(含表情符号,<300字):1.基础概念与环境TensorFlow架构(计算图、会话->EagerE...
- 交叉验证和超参数调整:如何优化你的机器学习模型
-
准确预测Fitbit的睡眠得分在本文的前两部分中,我获取了Fitbit的睡眠数据并对其进行预处理,将这些数据分为训练集、验证集和测试集,除此之外,我还训练了三种不同的机器学习模型并比较了它们的性能。在...
- 机器学习交叉验证全指南:原理、类型与实战技巧
-
机器学习模型常常需要大量数据,但它们如何与实时新数据协同工作也同样关键。交叉验证是一种通过将数据集分成若干部分、在部分数据上训练模型、在其余数据上测试模型的方法,用来检验模型的表现。这有助于发现过拟合...
- 深度学习中的类别激活热图可视化
-
作者:ValentinaAlto编译:ronghuaiyang导读使用Keras实现图像分类中的激活热图的可视化,帮助更有针对性...
- 超强,必会的机器学习评估指标
-
大侠幸会,在下全网同名[算法金]0基础转AI上岸,多个算法赛Top[日更万日,让更多人享受智能乐趣]构建机器学习模型的关键步骤是检查其性能,这是通过使用验证指标来完成的。选择正确的验证指...
- 机器学习入门教程-第六课:监督学习与非监督学习
-
1.回顾与引入上节课我们谈到了机器学习的一些实战技巧,比如如何处理数据、选择模型以及调整参数。今天,我们将更深入地探讨机器学习的两大类:监督学习和非监督学习。2.监督学习监督学习就像是有老师的教学...
- Python 模型部署不用愁!容器化实战,5 分钟搞定环境配置
-
你是不是也遇到过这种糟心事:花了好几天训练出的Python模型,在自己电脑上跑得顺顺当当,一放到服务器就各种报错。要么是Python版本不对,要么是依赖库冲突,折腾半天还是用不了。别再喊“我...
- 神经网络与传统统计方法的简单对比
-
传统的统计方法如...
- 自回归滞后模型进行多变量时间序列预测
-
下图显示了关于不同类型葡萄酒销量的月度多元时间序列。每种葡萄酒类型都是时间序列中的一个变量。假设要预测其中一个变量。比如,sparklingwine。如何建立一个模型来进行预测呢?一种常见的方...
- 苹果AI策略:慢哲学——科技行业的“长期主义”试金石
-
苹果AI策略的深度原创分析,结合技术伦理、商业逻辑与行业博弈,揭示其“慢哲学”背后的战略智慧:一、反常之举:AI狂潮中的“逆行者”当科技巨头深陷AI军备竞赛,苹果的克制显得格格不入:功能延期:App...
- 时间序列预测全攻略,6大模型代码实操
-
如果你对数据分析感兴趣,希望学习更多的方法论,希望听听经验分享,欢迎移步宝藏公众号...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- idea eval reset (50)
- vue dispatch (70)
- update canceled (42)
- order by asc (53)
- spring gateway (67)
- 简单代码编程 贪吃蛇 (40)
- transforms.resize (33)
- redisson trylock (35)
- 卸载node (35)
- np.reshape (33)
- torch.arange (34)
- npm 源 (35)
- vue3 deep (35)
- win10 ssh (35)
- vue foreach (34)
- idea设置编码为utf8 (35)
- vue 数组添加元素 (34)
- std find (34)
- tablefield注解用途 (35)
- python str转json (34)
- java websocket客户端 (34)
- tensor.view (34)
- java jackson (34)
- vmware17pro最新密钥 (34)
- mysql单表最大数据量 (35)