OSDP:用于分布式深度学习的最佳分片数据并行

摘要:Optimal Sharded Data Parallel: 一种优化的分片数据并行训练系统

作者:Youhe Jiang, Fangcheng Fu, Xupeng Miao, Xiaonan Nie, Bin Cui

论文ID:2305.09940

分类:Distributed, Parallel, and Cluster Computing

分类简称:cs.DC

提交时间:2023-05-19

PDF 下载: 英文版 中文版pdf翻译中