
DeepSpeedExamples: 示例模型中的 DeepSpeed 使用
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
DeepSpeedExamples 提供了一系列使用微软 DeepSpeed 优化技术的示例模型,帮助研究者和开发者轻松实现大规模深度学习训练。
此存储库包含使用示例模型的代码。关于威震天示例的说明如下:
Megatron-LM:这是 Megatron-LM 的一个较旧版本,我们一直用它来展示 DeepSpeed 早期的功能特性。这个版本不包括 ZeRO-3 或者 3D 并行性。
Megatron-LM-v1.1.5-3D_parallelism:这是一个相对较新的 Megatron 版本(2020年10月),但当时还不支持 3D 并行功能。我们移植了这个版本来展示如何在 DeepSpeed 中使用 Megatron 的 3D 并行性。
Megatron-LM-v1.1.5-ZeRO3:该版本的底层代码与 3D_parallelism 版本相同,但没有进行 3D 并行端口移植。然而,它包含了 DeepSpeed 的最新进展,包括 ZeRO-3、ZeRO-3 Offload 和 ZeRO-Infinity 功能。
全部评论 (0)
还没有任何评论哟~


