研究论文

使用图形处理器的大规模深度无监督学习

作者：
拉贾特·雷纳

斯坦福大学，加利福尼亚州斯坦福

斯坦福大学，加利福尼亚州斯坦福
查看配置文件

,
阿南德·马德哈万

斯坦福大学，加利福尼亚州斯坦福

斯坦福大学，加利福尼亚州斯坦福
查看配置文件

,
恩吉

斯坦福大学，加利福尼亚州斯坦福

斯坦福大学，加利福尼亚州斯坦福
查看配置文件

作者信息和声明

ICML'09：第26届机器学习国际年会论文集2009年6月第873-880页https://doi.org/10.1145/1553374.1553486

出版：2009年6月14日出版历史

ICML'09：第26届机器学习国际年会论文集

第873–880页

摘要

无监督学习方法的前景在于，它可以使用大量未标记的数据学习复杂、高度非线性的模型，其中包含数百万个自由参数。我们考虑了两种著名的无监督学习模型，即深度信念网络（DBN）和稀疏编码，这两种模型最近被应用于一系列机器学习应用程序（Hinton&Salakhutdinov，2006；Raina等人，2007）。不幸的是，目前这两种模型的学习算法对于大规模应用来说都太慢了，迫使研究人员将注意力集中在小规模模型上，或者使用更少的训练示例。

在本文中，我们建议使用大规模并行方法来帮助解决这些问题。我们认为，现代图形处理器的计算能力远远超过多核CPU，并有潜力彻底改变深度无监督学习方法的适用性。我们开发了使用图形处理器大规模并行化无监督学习任务的一般原则。我们表明，这些原则可以应用于DBN和稀疏编码的学习算法的成功扩展。对于大型模型，我们的DBN学习实现比双核CPU实现快70倍。例如，我们能够将学习一个具有1亿个免费参数的四层DBN所需的时间从几周减少到一天左右。对于稀疏编码，我们开发了一种简单、固有的并行算法，与以前的方法相比，该算法的速度提高了5到15倍。

工具书类

Andrew，G.和；Gao，J.（2007）。可扩展的培训L（左） ₁-正则化对数线性模型。机器学习国际会议（第33-40页）。谷歌学者数字图书馆
Banko，M.和；Brill，E.（2001）。扩展到非常非常大的语料库以消除自然语言的歧义。计算语言学协会年会（第26-33页）。谷歌学者数字图书馆
Bengio，Y.（2007）。加速随机梯度下降。神经信息处理系统高效机器学习研讨会.谷歌学者
Bengio，Y.、Lamblin，P.、Popovici，D.和；拉罗谢尔，H.（2006）。深度网络的贪婪分层培训。神经信息处理系统（第153-160页）。谷歌学者
Bradley，D.和；Bagnell，J.A.（2008）。可微分稀疏编码。神经信息处理系统（第113-120页）。谷歌学者
Brants，T.、Popat，A.C.、Xu，P.、Och，F.J.和；Dean，J.（2007）。机器翻译中的大型语言模型。自然语言处理经验方法会议（EMNLP-CoNLL）.谷歌学者
Catanzaro，B.C.，Sundaram，N.和；Keutzer，K.（2008）。图形处理器上的快速支持向量机训练和分类。机器学习国际会议（第104-111页）。谷歌学者数字图书馆
Chellapilla，K.、Puri，S.和；Simard，P.（2006）。用于文档处理的高性能卷积神经网络。手写识别前沿国际研讨会.谷歌学者
Chu，C.T.、Kim，S.K.、Lin，Y.A.、Yu，Y.、Bradski，G.R.、Ng，A.Y.和；Olukotun，K.（2006）。用于多核机器学习的地图还原。神经信息处理系统（第281--288页）。谷歌学者
Dean，J.和；Ghemawat，S.（2004）。Mapreduce：简化大型集群上的数据处理。操作系统设计与实现（第137-150页）。谷歌学者数字图书馆
Desjardins，G.和；Bengio，Y.（2008）。卷积RBM视觉的实证评估。技术报告.谷歌学者
Efron，B.，Hastie，T.，Johnstone，I.，&amp；Tibshirani，R.（2004）。最小角度回归。Ann.Stat.，32岁, 407.谷歌学者交叉引用
Frank，D.（2002）。功率受限的CMOS缩放限制。IBM焦耳。Res.和Devel。，46, 235--244.谷歌学者数字图书馆
Friedman，J.、Hastie，T.、Hfling，H.和；Tibshirani，R.（2007）。路径坐标优化。附录。统计，2, 302--332.谷歌学者交叉引用
Gelsinger，P.（2001）。新千年的微处理器：挑战、机遇和新领域。ISSCC技术摘要, 22--25.谷歌学者
Goto，K.，&；Van De Geijn，R.（2008）。三级BLAS的高性能实施。ACM事务处理。数学。柔软。，35, 1--14.谷歌学者数字图书馆
Harris，M.（2008）。NVIDIA CUDA多核GPU计算。国际协调超级计算（第1页）。谷歌学者数字图书馆
Hinton，G.E.（2002年）。通过最小化对比差异来培训专家产品。神经计算，14, 1771--1800.谷歌学者数字图书馆
Hinton，G.E.、Osindero，S.和；Teh，Y.-W.（2006）。一种深度信念网的快速学习算法。神经计算，18, 1527--1554.谷歌学者数字图书馆
Hinton，G.E.和；萨拉赫季诺夫，R.R.（2006）。利用神经网络降低数据的维数。科学，313, 504--507.谷歌学者交叉引用
Kavukcuoglu，K.、Ranzato，M.和；LeCun，Y.（2008）。稀疏编码算法中的快速推理及其在目标识别中的应用。纽约大学技术报告.谷歌学者
Lee，H.、Battle，A.、Raina，R.和；Ng，A.Y.（2006）。高效的稀疏编码算法。神经信息处理系统（第801-808页）。谷歌学者
Lee，H.、Chaitanya，E.和；Ng，A.Y.（2007）。视觉区域V2的稀疏深度信念网模型。神经信息处理系统（第873-880页）。谷歌学者
Lee，H.、Grosse，R.、Ranganath，R.和；Ng，A.Y.（2009）。用于分层表示的可扩展无监督学习的卷积深信念网络。国际机器学习会议（即将召开）.谷歌学者数字图书馆
Murray，J.F.和；Kreutz-Delgado，K.（2006年）。学习图像的稀疏超完备代码。超大规模集成电路信号处理系统，45, 97--110.谷歌学者数字图书馆
Ng，A.Y.（2004）。特征选择，L（左） ₁与。L（左） ₂正则化和旋转不变性。机器学习国际会议（第78-85页）。谷歌学者数字图书馆
Olshausen，B.A.，&；Field，D.J.（1996）。通过学习自然图像的稀疏代码，出现了简单的细胞感受野特性。自然，381, 607--609.谷歌学者交叉引用
Raina，R.、Battle，A.、Lee，H.、Packer，B.和；Ng，A.Y.（2007）。自学学习：从未标记的数据中转移学习。机器学习国际会议（第759-766页）。谷歌学者数字图书馆
Ranzato，M.A.和；Szummer，M.（2008）。使用深层网络对紧凑文档表示进行半监督学习。机器学习国际会议（第792-799页）。谷歌学者数字图书馆
Salakhutdinov，R.和；Hinton，G.（2007年）。语义哈希。SIGIR图形模型信息检索与应用研讨会.谷歌学者
Tibshirani，R.（1996）。通过套索回归收缩和选择。J.R.Stat.Soc.B.，58岁, 267--288.谷歌学者交叉引用
van Hateren，J.H.和；van der Schaaff，A.（1997）。与初级视觉皮层中的简单细胞相比，自然图像的独立成分过滤器。英国皇家学会。B、 265个, 359--366.谷歌学者交叉引用
R.C.Whaley、A.Petitet和；Dongarra，J.J.（2001）。软件和ATLAS项目的自动经验优化。并行计算，27, 3--35.谷歌学者数字图书馆

索引术语

使用图形处理器的大规模深度无监督学习
1. 计算方法
2. 计算理论
  1. 计算模型
    1. 并发
      1. 并行计算模型

建议

图形处理器上的关系查询协同处理

图形处理器（GPU）最近成为通用计算的强大协处理器。与商品CPU相比，GPU的计算能力和内存带宽都要高出一个数量级。此外，新一代GPU。。。
阅读更多信息
使用CUDA的图形处理器上通用应用程序的性能研究

图形处理器（GPU）提供了大量简单、数据并行、深度多线程内核和高内存带宽。GPU架构正在变得越来越可编程，为各种。。。
阅读更多信息
使用图形处理器加速cfd和数据分析
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

发布于
ICML'09：第26届机器学习国际年会论文集
2009年6月
1331页
国际标准图书编号：9781605585161
内政部：10.1145/1553374
总主席：
安德烈亚·达尼卢克
威廉姆斯学院
,
课程主席：
莱昂·博图
NEC美国实验室
,
利特曼
美国罗格斯大学
版权所有©2009作者/所有者版权所有。
赞助商
合作中
出版商
计算机协会
美国纽约州纽约市
出版历史
- 出版：2009年6月14日
权限
请求有关此文章的权限。
请求权限

检查更新
限定符
- 研究论文
会议

验收费率
总体验收率140属于548提交文件，26%
资金来源
其他指标
查看文章指标

文章指标
- 375
  引文总数
  查看引文
- 3,101
  总下载次数
- 下载次数（过去12个月）141
- 下载次数（最近6周）17
其他指标
查看作者指标
引用人
查看全部

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

使用图形处理器的大规模深度无监督学习

ICML'09：第26届机器学习国际年会论文集

摘要

工具书类

引用人

索引术语

建议

图形处理器上的关系查询协同处理

使用CUDA的图形处理器上通用应用程序的性能研究

使用图形处理器加速cfd和数据分析

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

权限

检查更新

限定符

会议

验收费率

资金来源

其他指标

文章指标

其他指标

引用人

PDF格式

电子阅读器

数字版

解说词

使用图形处理器的大规模深度无监督学习

ICML'09：第26届机器学习国际年会论文集

摘要

工具书类

引用人

索引术语

建议

图形处理器上的关系查询协同处理

使用CUDA的图形处理器上通用应用程序的性能研究

使用图形处理器加速cfd和数据分析

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

权限

检查更新

限定符

会议

验收费率

资金来源

文章指标

其他指标

PDF格式

电子阅读器

数字版

共享此出版物链接

在社交媒体上分享