×

G管道

swMATH ID: 39466
软件作者: 黄延平、程友龙、安库尔·巴普纳、奥汉·菲拉特、米娅·许晨、陈德浩、李孝忠、吉全·尼亚姆、郭文乐、吴永辉、陈志峰
描述: GPipe:使用流水线并行性对巨型神经网络进行有效训练。扩大深度神经网络能力被认为是提高几种不同机器学习任务的模型质量的有效方法。在许多情况下,将模型容量增加到超过单个加速器的内存限制需要开发特殊的算法或基础设施。这些解决方案通常是特定于体系结构的,不会转移到其他任务。为了满足高效且与任务相关的模型并行的需要,我们引入了GPipe,这是一个管道并行库,它允许缩放任何可以表示为层序列的网络。通过在单独的加速器上流水线化不同的子序列层,GPipe提供了将各种不同的网络有效扩展到巨大规模的灵活性。此外,GPipe使用了一种新颖的批处理分割流水线算法,当模型跨多个加速器进行分区时,其加速比几乎是线性的。我们通过使用不同的网络结构在两个不同的任务上训练大规模神经网络来展示GPipe的优势:(i)图像分类:我们训练了一个5.57亿参数的AmoebaNet模型,获得了84.4的顶级精度
主页: https://paperswithcode.com/paper/gpipe-efficient-training-of-giant-neural
相关软件: CIFAR公司;ImageNet公司;PyTorch公司;效率网;AlexNet公司;TensorFlow公司;github;HOGWILD公司;Tensor2传感器;GNMT公司;BiT公司;深度SDF;城市风光;AMC公司;MgNet公司;移动网络;混洗网;GPT-3级;MobileNetV2手机;LAMG公司
引用于: 12文件

按年份列出的引文