跳到主要内容
10.1145/1553374.1553486交流会议文章/章节视图摘要出版物页面国际化学品管理局会议记录会议集合
研究论文

使用图形处理器的大规模深度无监督学习

出版:2009年6月14日出版历史

摘要

无监督学习方法的前景在于,它可以使用大量未标记的数据学习复杂、高度非线性的模型,其中包含数百万个自由参数。我们考虑了两种著名的无监督学习模型,即深度信念网络(DBN)和稀疏编码,这两种模型最近被应用于一系列机器学习应用程序(Hinton&Salakhutdinov,2006;Raina等人,2007)。不幸的是,目前这两种模型的学习算法对于大规模应用来说都太慢了,迫使研究人员将注意力集中在小规模模型上,或者使用更少的训练示例。

在本文中,我们建议使用大规模并行方法来帮助解决这些问题。我们认为,现代图形处理器的计算能力远远超过多核CPU,并有潜力彻底改变深度无监督学习方法的适用性。我们开发了使用图形处理器大规模并行化无监督学习任务的一般原则。我们表明,这些原则可以应用于DBN和稀疏编码的学习算法的成功扩展。对于大型模型,我们的DBN学习实现比双核CPU实现快70倍。例如,我们能够将学习一个具有1亿个免费参数的四层DBN所需的时间从几周减少到一天左右。对于稀疏编码,我们开发了一种简单、固有的并行算法,与以前的方法相比,该算法的速度提高了5到15倍。

工具书类

  1. Andrew,G.和;Gao,J.(2007)。可扩展的培训L(左) 1-正则化对数线性模型。机器学习国际会议(第33-40页)。谷歌学者谷歌学者数字图书馆数字图书馆
  2. Banko,M.和;Brill,E.(2001)。扩展到非常非常大的语料库以消除自然语言的歧义。计算语言学协会年会(第26-33页)。谷歌学者谷歌学者数字图书馆数字图书馆
  3. Bengio,Y.(2007)。加速随机梯度下降。神经信息处理系统高效机器学习研讨会.谷歌学者谷歌学者
  4. Bengio,Y.、Lamblin,P.、Popovici,D.和;拉罗谢尔,H.(2006)。深度网络的贪婪分层培训。神经信息处理系统(第153-160页)。谷歌学者谷歌学者
  5. Bradley,D.和;Bagnell,J.A.(2008)。可微分稀疏编码。神经信息处理系统(第113-120页)。谷歌学者谷歌学者
  6. Brants,T.、Popat,A.C.、Xu,P.、Och,F.J.和;Dean,J.(2007)。机器翻译中的大型语言模型。自然语言处理经验方法会议(EMNLP-CoNLL).谷歌学者谷歌学者
  7. Catanzaro,B.C.,Sundaram,N.和;Keutzer,K.(2008)。图形处理器上的快速支持向量机训练和分类。机器学习国际会议(第104-111页)。谷歌学者谷歌学者数字图书馆数字图书馆
  8. Chellapilla,K.、Puri,S.和;Simard,P.(2006)。用于文档处理的高性能卷积神经网络。手写识别前沿国际研讨会.谷歌学者谷歌学者
  9. Chu,C.T.、Kim,S.K.、Lin,Y.A.、Yu,Y.、Bradski,G.R.、Ng,A.Y.和;Olukotun,K.(2006)。用于多核机器学习的地图还原。神经信息处理系统(第281--288页)。谷歌学者谷歌学者
  10. Dean,J.和;Ghemawat,S.(2004)。Mapreduce:简化大型集群上的数据处理。操作系统设计与实现(第137-150页)。谷歌学者谷歌学者数字图书馆数字图书馆
  11. Desjardins,G.和;Bengio,Y.(2008)。卷积RBM视觉的实证评估。技术报告.谷歌学者谷歌学者
  12. Efron,B.,Hastie,T.,Johnstone,I.,&Tibshirani,R.(2004)。最小角度回归。Ann.Stat.,32岁, 407.谷歌学者谷歌学者交叉引用交叉引用
  13. Frank,D.(2002)。功率受限的CMOS缩放限制。IBM焦耳。Res.和Devel。,46, 235--244.谷歌学者谷歌学者数字图书馆数字图书馆
  14. Friedman,J.、Hastie,T.、Hfling,H.和;Tibshirani,R.(2007)。路径坐标优化。附录。统计,2, 302--332.谷歌学者谷歌学者交叉引用交叉引用
  15. Gelsinger,P.(2001)。新千年的微处理器:挑战、机遇和新领域。ISSCC技术摘要, 22--25.谷歌学者谷歌学者
  16. Goto,K.,&;Van De Geijn,R.(2008)。三级BLAS的高性能实施。ACM事务处理。数学。柔软。,35, 1--14.谷歌学者谷歌学者数字图书馆数字图书馆
  17. Harris,M.(2008)。NVIDIA CUDA多核GPU计算。国际协调超级计算(第1页)。谷歌学者谷歌学者数字图书馆数字图书馆
  18. Hinton,G.E.(2002年)。通过最小化对比差异来培训专家产品。神经计算,14, 1771--1800.谷歌学者谷歌学者数字图书馆数字图书馆
  19. Hinton,G.E.、Osindero,S.和;Teh,Y.-W.(2006)。一种深度信念网的快速学习算法。神经计算,18, 1527--1554.谷歌学者谷歌学者数字图书馆数字图书馆
  20. Hinton,G.E.和;萨拉赫季诺夫,R.R.(2006)。利用神经网络降低数据的维数。科学,313, 504--507.谷歌学者谷歌学者交叉引用交叉引用
  21. Kavukcuoglu,K.、Ranzato,M.和;LeCun,Y.(2008)。稀疏编码算法中的快速推理及其在目标识别中的应用。纽约大学技术报告.谷歌学者谷歌学者
  22. Lee,H.、Battle,A.、Raina,R.和;Ng,A.Y.(2006)。高效的稀疏编码算法。神经信息处理系统(第801-808页)。谷歌学者谷歌学者
  23. Lee,H.、Chaitanya,E.和;Ng,A.Y.(2007)。视觉区域V2的稀疏深度信念网模型。神经信息处理系统(第873-880页)。谷歌学者谷歌学者
  24. Lee,H.、Grosse,R.、Ranganath,R.和;Ng,A.Y.(2009)。用于分层表示的可扩展无监督学习的卷积深信念网络。国际机器学习会议(即将召开).谷歌学者谷歌学者数字图书馆数字图书馆
  25. Murray,J.F.和;Kreutz-Delgado,K.(2006年)。学习图像的稀疏超完备代码。超大规模集成电路信号处理系统,45, 97--110.谷歌学者谷歌学者数字图书馆数字图书馆
  26. Ng,A.Y.(2004)。特征选择,L(左) 1与。L(左) 2正则化和旋转不变性。机器学习国际会议(第78-85页)。谷歌学者谷歌学者数字图书馆数字图书馆
  27. Olshausen,B.A.,&;Field,D.J.(1996)。通过学习自然图像的稀疏代码,出现了简单的细胞感受野特性。自然,381, 607--609.谷歌学者谷歌学者交叉引用交叉引用
  28. Raina,R.、Battle,A.、Lee,H.、Packer,B.和;Ng,A.Y.(2007)。自学学习:从未标记的数据中转移学习。机器学习国际会议(第759-766页)。谷歌学者谷歌学者数字图书馆数字图书馆
  29. Ranzato,M.A.和;Szummer,M.(2008)。使用深层网络对紧凑文档表示进行半监督学习。机器学习国际会议(第792-799页)。谷歌学者谷歌学者数字图书馆数字图书馆
  30. Salakhutdinov,R.和;Hinton,G.(2007年)。语义哈希。SIGIR图形模型信息检索与应用研讨会.谷歌学者谷歌学者
  31. Tibshirani,R.(1996)。通过套索回归收缩和选择。J.R.Stat.Soc.B.,58岁, 267--288.谷歌学者谷歌学者交叉引用交叉引用
  32. van Hateren,J.H.和;van der Schaaff,A.(1997)。与初级视觉皮层中的简单细胞相比,自然图像的独立成分过滤器。英国皇家学会。B、 265个, 359--366.谷歌学者谷歌学者交叉引用交叉引用
  33. R.C.Whaley、A.Petitet和;Dongarra,J.J.(2001)。软件和ATLAS项目的自动经验优化。并行计算,27, 3--35.谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. 使用图形处理器的大规模深度无监督学习

              建议

              评论

              登录选项

              检查您是否可以通过登录凭据或您的机构访问本文。

              登录

              完全访问权限

              • 发布于

                封面图片ACM其他会议
                ICML'09:第26届机器学习国际年会论文集
                2009年6月
                1331页
                国际标准图书编号:9781605585161
                内政部:10.1145/1553374

                版权所有©2009作者/所有者版权所有。

                出版商

                计算机协会

                美国纽约州纽约市

                出版历史

                • 出版:2009年6月14日

                权限

                请求有关此文章的权限。

                请求权限

                检查更新

                限定符

                • 研究论文

                验收费率

                总体验收率140属于548提交文件,26%

              PDF格式

              以PDF文件查看或下载。

              PDF格式

              电子阅读器

              使用eReader联机查看。

              电子阅读器