跳到主要内容
10.1145/2670979.2670984acm会议文章/章节视图摘要出版物页面国防部会议记录会议集合
辅导的

利用迭代法进行并行ML计算

出版:2014年11月3日出版历史

摘要

许多大规模机器学习(ML)应用程序使用迭代算法来收敛于使所选模型适合输入数据的参数值。通常,这种方法会导致重复每次迭代的相同的参数访问顺序。本文表明,可以而且应该利用这些重复模式来提高并行和分布式ML应用程序的效率,这些应用程序将成为云计算环境中的主流。我们将重点放在日益流行的在工作线程之间共享模型参数的“参数服务器”方法上,描述并演示如何利用重复模式。例如,将动态缓存和服务器结构替换为静态预序列化结构,通知预取和分区决策,并确定应在每个线程上缓存哪些数据,以避免对连接到其他套接字的内存库的争用和缓慢访问。实验表明,对于三种真实的ML工作负载,这种利用可以将重复时间减少33-98%,并且这些改进对模式随时间的变化具有鲁棒性。

工具书类

  1. A.Ahmed、M.Aly、J.Gonzalez、S.Narayanamurthy和A.J.Smola。潜在变量模型中的可缩放推理。WSDM,2012年。谷歌学者谷歌学者数字图书馆数字图书馆
  2. S.Ahn、B.Shahbaba和M.Welling。分布随机梯度MCMC。ICML,2014年。谷歌学者谷歌学者数字图书馆数字图书馆
  3. M.Awasthi、D.Nellans、K.Sudan、R.Balasubramonian和A.Davis。处理多个片上内存控制器带来的问题和机遇。在2010年的PACT中。谷歌学者谷歌学者数字图书馆数字图书馆
  4. W.Bolosky、R.Fitzgerald和M.Scott。用于numa内存管理的简单但有效的技术。SOSP,1989年。谷歌学者谷歌学者数字图书馆数字图书馆
  5. S.Brin和L.Page。对大型超文本Web搜索引擎的剖析。计算机网络,1998年。谷歌学者谷歌学者数字图书馆数字图书馆
  6. A.Brown、T.Mowry和O.Krieger。用于核心外应用程序的基于编译器的I/O预取。2001年ACM计算机系统交易(TOCS)。谷歌学者谷歌学者数字图书馆数字图书馆
  7. Y.Bu、B.Howe、M.Balazinska和M.D.Ernst。Haloop:大型集群上的高效迭代数据处理。程序中。VLDB Endow,2010年。谷歌学者谷歌学者数字图书馆数字图书馆
  8. S.Byna、Y.Chen、X.Sun、R.Thakur和W.Gropp。使用MPI文件缓存和I/O签名进行并行I/O预取。在ACM/IEEE超级计算,2008年。谷歌学者谷歌学者数字图书馆数字图书馆
  9. P.Cao、E.Felton和K.Li。应用程序控制的文件缓存的实现和性能。OSDI,1994年。谷歌学者谷歌学者数字图书馆数字图书馆
  10. R.Chandra、S.Devine、B.Verghese、A.Gupta和M.Rosenblum。多处理器计算服务器的调度和页面迁移。ASPLOS,1994年。谷歌学者谷歌学者数字图书馆数字图书馆
  11. F.Chang和G.A.Gibson。通过推测执行自动生成I/O提示。OSDI,1999年。谷歌学者谷歌学者数字图书馆数字图书馆
  12. C.-T.Chu、S.K.Kim、Y.A.Lin、Y.Yu、G.Bradski、A.Ng和K.Olukotun。用于多核机器学习的地图还原。NIPS,2006年。谷歌学者谷歌学者
  13. J.Cipar、Q.Ho、J.K.Kim、S.Lee、G.R.Ganger、G.Gibson、K.Keeton和E.Xing。解决有界过时的掉队者问题。在HotOS中,2013年。谷歌学者谷歌学者数字图书馆数字图书馆
  14. A.Coates、B.Huval、T.Wang、D.Wu、B.Catanzaro和N.Andrew。深入学习COTS HPC系统。ICML,2013年。谷歌学者谷歌学者数字图书馆数字图书馆
  15. H.Cui、J.Cipar、Q.Ho、J.K.Kim、S.Lee、A.Kumar、J.Wei、W.Dai、G.R.Ganger、P.B.Gibbons、G.A.Gibson和E.P.Xing。利用有限陈旧性加快大数据分析。USENIX ATC,2014年。谷歌学者谷歌学者数字图书馆数字图书馆
  16. J.Dean、G.Corrado、R.Monga、K.Chen、M.Devin、Q.Le、M.Mao、M.Ranzato、A.Senior、P.Tucker、K.Yang和A.Ng。大规模分布式深层网络。NIPS,2012年。谷歌学者谷歌学者数字图书馆数字图书馆
  17. K.Fraser和F.Chang。操作系统I/O推测:两次调用比一次调用快多少。在2003年USENIX年度技术会议上。谷歌学者谷歌学者
  18. R.Gemulla、E.Nijkamp、P.J.Haas和Y.Sismanis。具有分布随机梯度下降的大尺度矩阵分解。KDD,2011年。谷歌学者谷歌学者数字图书馆数字图书馆
  19. A.Gerbessiotis和L.Valiant。直接批量同步并行算法。1992年,在斯堪的纳维亚算法理论研讨会上。谷歌学者谷歌学者数字图书馆数字图书馆
  20. G.Gibson、G.Grider、A.Jacobson和W Lloyd。PRObE:用于计算机系统研究的千节点实验集群。USENIX公司;登录:,2013年。谷歌学者谷歌学者
  21. J.Gonzalez,Y Low,H.Gu,D.Bickson和C.Guestrin。PowerGraph:自然图上的分布式图并行计算。OSDI,2012年。谷歌学者谷歌学者数字图书馆数字图书馆
  22. J.Griffoen和R.Appleton。使用预测方法减少文件系统延迟。1994年夏季USENIX。谷歌学者谷歌学者数字图书馆数字图书馆
  23. T.L.Griffiths和M.Steyvers。寻找科学主题。美国国家科学院院刊,2004年。谷歌学者谷歌学者交叉引用交叉引用
  24. Q.Ho、J.Cipar、H.Cui、S.Lee、J.K.Kim、P.B.Gibbons、G.A.Gibson、G.R.Ganger和E.P.Xing。通过过时的同步并行参数服务器实现更有效的分布式ML。NIPS,2013年。谷歌学者谷歌学者数字图书馆数字图书馆
  25. 英特尔。英特尔®线程构建块。https://www.threadingbuildingblocks.org。谷歌学者谷歌学者
  26. H.Kwak、C.Lee、H.Park和S.Moon。什么是推特、社交网络或新闻媒体?WWW,2010年。谷歌学者谷歌学者数字图书馆数字图书馆
  27. A.Kyrola、G.Blelloch和C.Guestrin。GraphChi:仅在PC上进行大规模图形计算。OSDI,2012年。谷歌学者谷歌学者数字图书馆数字图书馆
  28. J.Langford、A.J.Smola和M.Zinkevich。慢学习者速度快。NIPS,2009年。谷歌学者谷歌学者数字图书馆数字图书馆
  29. H.Lei和D.Duchamp。文件预取的分析方法。在1997年USENIX年度技术会议上。谷歌学者谷歌学者数字图书馆数字图书馆
  30. Y.Low、J.Gonzalez、A.Kyrola、D.Bickson、C.Guestrin和J.M.Hellerstein。GraphLab:一种新的机器学习并行框架。阿联酋,2010年。谷歌学者谷歌学者数字图书馆数字图书馆
  31. G.Malewicz、M.H.Austern、A.J.Bik、J.C.Dehnert、I.Horn、N.Leiser和G.Czajkowski。Pregel:用于大规模图形处理的系统。SIGMOD,2010年。谷歌学者谷歌学者数字图书馆数字图书馆
  32. D.Murray、F.McSherry、R.Isaacs、M.Isard、P.Barham和M.Abadi。Naiad:一个及时的数据流系统。SOSP,2013年。谷歌学者谷歌学者数字图书馆数字图书馆
  33. R.H.Patterson、G.A.Gibson、E.Ginting、D.Stodolsky和J.Zelenka。通知预取和缓存。SOSP,1995年。谷歌学者谷歌学者数字图书馆数字图书馆
  34. D.Peng和F.Dabek。使用分布式事务和通知的大规模增量处理。在OSDI,2010年。谷歌学者谷歌学者数字图书馆数字图书馆
  35. R.Power和J.Li.Piccolo:用分区表构建快速的分布式程序。OSDI,2010年。谷歌学者谷歌学者数字图书馆数字图书馆
  36. A.Roy、I.Mihailovic和W.Zwaenepoel。X-Stream:使用流分区的以边缘为中心的图形处理。SOSP,2013年。谷歌学者谷歌学者数字图书馆数字图书馆
  37. 蒂勒普罗。TILEPro处理器系列:TILEPro64概述。http://www.tilera.com/products/processors/TILEPro_Family网站, 2013.谷歌学者谷歌学者
  38. A.Tumanov、J.Wise、O.Mutlu和G.R.Ganger。多核芯片上的非对称软件执行位置。2013年,在未来多核架构(SFMA)系统研讨会上。谷歌学者谷歌学者
  39. UCI。UCI机器学习库。http://archive.ics.uci.edu/ml/datasets/Bag+共+个单词。谷歌学者谷歌学者
  40. Y.Wang,X.Zhao,Z.Sun,H.Yan,L.Wang,Z.Jin,L.Wang,Y.Gao,J.Zeng,Q.Yang,et al.面向大数据的主题建模。arXiv预印arXiv:1405.44022014。谷歌学者谷歌学者
  41. M.Zaharia、T.Das、H.Li、S.Shenker和I.Stoica。离散流:在大型集群上进行流处理的高效容错模型。SOSP,2013年。谷歌学者谷歌学者数字图书馆数字图书馆
  42. R.Zhang和J.Kwok。用于全局变量一致性优化的异步分布式ADMM算法。ICML,2014年。谷歌学者谷歌学者
  43. Y.Zhang、Q.Gao、L.Gao和C.Wang。PrIter:用于优先迭代计算的分布式框架。SoCC,2011年。谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. 利用迭代法进行并行ML计算

              建议

              评论

              登录选项

              检查您是否可以通过登录凭据或您的机构访问本文。

              登录

              完全访问权限

              • 发布于

                封面图片ACM会议
                SOCC’14:ACM云计算研讨会会议记录
                2014年11月
                383页
                国际标准图书编号:9781450332521
                内政部:10.1145/2670979

                版权所有©2014 ACM

                允许制作本作品的全部或部分数字或硬拷贝供个人或课堂使用,但不收取任何费用,前提是复制品的制作或分发不是为了盈利或商业利益,并且复制品在首页注明本通知和完整引文。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。向请求权限[电子邮件保护]

                出版商

                计算机协会

                美国纽约州纽约市

                出版历史

                • 出版:2014年11月3日

                权限

                请求有关此文章的权限。

                请求权限

                检查更新

                限定符

                • 辅导的
                • 研究
                • 推荐有限公司

                验收费率

                总体验收率169属于722提交文件,23%

              PDF格式

              以PDF文件查看或下载。

              PDF格式

              电子阅读器

              使用eReader联机查看。

              电子阅读器