特恩格拉德 swMATH ID: 22206 软件作者: 魏文、丛旭、冯燕、吴春鹏、王燕丹、陈依然、海丽 描述: TernGrad:减少分布式深度学习中交流的三级梯度。同步梯度和参数的高网络通信成本是分布式训练的众所周知的瓶颈。在这项工作中,我们提出了TernGrad,它使用三元梯度来加速数据并行中的分布式深度学习。我们的方法只需要三个数值级别{-1,0,1},这可以大大减少通信时间。在梯度有界的假设下,我们用数学方法证明了TernGrad的收敛性。在边界的指导下,我们提出了分层标准化和梯度裁剪来提高其收敛性。我们的实验表明,在AlexNet上应用TernGrad不会造成任何精度损失,甚至可以提高精度。TernGrad导致GoogLeNet的精度损失小于2 主页: https://github.com/wenwei202/terngrad网站 源代码: https://github.com/wenwei202/terngrad 关键词: 学习;arXiv公司。LG公司;分布式;平行;和集群计算;arXiv公司。直流;神经与进化计算;arXiv公司。氖;arXiv公司;深度学习;三元梯度 相关软件: HOGWILD公司;TensorFlow公司;传奇;脚手架;ImageNet公司;CIFAR公司;Wasserstein甘;GeoMF公司;mpi4py;CNTK公司;宠物4py;AIDE公司;伦敦银行支持向量机;NSGA-II公司;XNOR-网络;二进制网络;二进制连接;皮莫;亚当;宾州树库 引用于: 7文件 全部的 前5名被26位作者引用 2 Stich,Sebastian U。 1 维塔利·阿克塞诺夫 1 Dan Alistarh 1 Aleksandr Beznosikov 1 陈梦强 1 达里娜·德文斯基 1 法格里、法塔什 1 Aleksandr V.加斯尼科夫。 1 爱德华·戈尔布诺夫 1 郭斌斌 1 塞缪尔·霍瓦思 1 胡志斌 1 阿塔州卡班 1 西普拉内斯省卡里米雷迪 1 德米特里·科瓦列夫。 1 邝迪 1 伊利亚·马尔科夫 1 梅,袁 1 康斯坦丁·米什琴科 1 阿里·拉梅扎尼·凯布里亚 1 彼得·里奇塔里克 1 亚历山大·罗戈津 1 丹尼尔·罗伊(Daniel M.Roy)。 1 安德鲁·特纳。 1 肖丹阳 1 周雪斌 5篇连载文章中引用 2 机器学习研究杂志 1 信息科学 1 机器学习 1 人工智能研究杂志 1 优化方法和软件 在3个字段中引用 5 计算机科学(68至XX) 2 运筹学、数学规划(90-XX) 1 系统论;控制(93至XX) 按年份列出的引文