跳到主要内容
10.1145/1654059.1654103acm会议文章/章节视图摘要出版物页面供应链会议记录会议集合
研究论文

PFunc:现代高性能计算的现代任务并行

出版:2009年11月14日出版历史

摘要

由于硬件和软件的范式转变,HPC今天面临着新的挑战。多核、多核和GPGPU的普遍存在迫使传统的串行和分布式内存并行应用程序对这些架构进行并行化。信息学等领域的新兴应用对尚未解决的并行编程工具提出了独特的要求。尽管在所有可用的并行编程模型中,任务并行似乎是应对这些新挑战的最有希望的方法,但当前的任务并行解决方案并不充分。本文介绍了一个新的任务并行库PFunc,它通过自定义任务调度、任务优先级、任务相关性、多个完成通知和任务组扩展了当前任务并行解决方案的特征集。这些功能使PFunc能够自然高效地并行化各种现代HPC应用程序,并支持并行编程的SPMD模型。我们提供了三个案例研究:需求驱动的DAG执行、频繁模式挖掘和迭代稀疏解算器,以证明PFunc的新功能的实用性。

工具书类

  1. Cray XMT编程环境用户指南克雷。http://docs.cray.com。谷歌学者谷歌学者
  2. 性能应用程序编程接口创新计算实验室,田纳西州诺克斯维尔。谷歌学者谷歌学者
  3. 频繁项集挖掘实现(FIMI)研讨会的数据集赫尔辛基大学,2004年。http://fimi.cs.helsinki.fi/。谷歌学者谷歌学者
  4. 马丁·阿巴迪和莱斯利·兰波特。组成规范。ACM编程语言与系统汇刊(TOPLAS1993年1月15日(1)。谷歌学者谷歌学者数字图书馆数字图书馆
  5. 拉凯什·阿格拉瓦尔、托马斯·伊米林斯基和阿伦·斯瓦米。挖掘大型数据库中项目集之间的关联规则。SIGMOD'93:1993年ACM SIGMOD国际数据管理会议记录,第207--216页,美国纽约州纽约市,1993年。ACM公司。谷歌学者谷歌学者数字图书馆数字图书馆
  6. Rakesh Agrawal和Ramakrishnan Srikant。大型数据库中关联规则挖掘的快速算法。94年VLDB:第20届超大数据库国际会议记录,第487--499页,美国加利福尼亚州旧金山,1994年。摩根考夫曼出版公司。谷歌学者谷歌学者数字图书馆数字图书馆
  7. 埃里克·艾伦(Eric Allen)、大卫·蔡斯(David Chase)、乔·哈雷特(Joe Hallett)、维克托·卢昌科(Victor Luchangco)、詹·威勒姆·马森(Jan-Willem Maessen)、素京·柳(Sukyoung Ryu)、盖伊·斯蒂尔(Guy L.Steele Jr。《堡垒语言规范》1.0版。技术报告,太阳微系统公司,2008年。谷歌学者谷歌学者
  8. P.An、A.Jula、S.Rus、S.Saunders、T.Smith、G.Tanase、N.Thomas、N.Amato和L.Rauchwerger。STAPL:一个标准的模板自适应并行C++库。高性能嵌入式处理器高级编译器技术国际研讨会,第10页,2001年7月。谷歌学者谷歌学者
  9. 平安(Ping An)、阿林·朱拉(Alin Jula)、西尔维斯·罗斯(Silvius Rus)、史蒂文·桑德斯(Steven Saunders)、蒂姆·史密斯(Tim Smith)、加布里埃尔·塔纳斯(Gabriel Tanase)、内森·托马斯(Nathan Thomas)、南希·阿。STAPL:一个适用于C++的自适应通用并行编程库。并行计算语言和编译器研讨会,第193-208页,2001年8月。谷歌学者谷歌学者数字图书馆数字图书馆
  10. 巴奇(B Bacci)、戈拉奇(S Gorlatch)、伦格(C Lengauer)和佩拉加蒂(S Pelagatti)。集成并行编程环境中的框架和转换。并行计算技术(PaCT-99)1999年1月。谷歌学者谷歌学者数字图书馆数字图书馆
  11. Micheal A.Bender和Micheal O.Rabin.异构系统上并行程序的在线调度及其在Cilk中的应用。SPAA00计算系统理论专刊, 35:289--304, 2002.谷歌学者谷歌学者交叉引用交叉引用
  12. 乔恩·路易斯·本特利。用于关联搜索的多维二进制搜索树。Commun公司。ACM公司, 18(9):509--517, 1975.谷歌学者谷歌学者数字图书馆数字图书馆
  13. 罗伯特·布鲁莫夫(Robert D.Blumofe)和查尔斯·雷瑟森(Charles E.Leiserson)。通过工作窃取调度多线程计算。第35届计算机科学基础年会论文集,第356-368页,1994年。谷歌学者谷歌学者数字图书馆数字图书馆
  14. E.Boiten、A.Geerling和H.Partsch。使用骨架的(并行)程序的转换派生。谷歌学者谷歌学者
  15. 安斯加·布吕尔(Ansgar Brüll)和赫伯特·库琴(Herbert Kuchen)。TPascal-任务并行编程语言。96年欧洲-巴黎:第二届平行处理国际欧洲-巴黎会议记录,第654-659页,英国伦敦,1996年。斯普林格·弗拉格。谷歌学者谷歌学者数字图书馆数字图书馆
  16. Bradford L.Chamberlain、David Callahan和Hans P.Zima。并行可编程性和Chapel语言。国际高性能计算应用杂志2007年1月。谷歌学者谷歌学者数字图书馆数字图书馆
  17. K Chandy和C Kesselman。CC++:一种声明性并发面向对象编程符号。并发面向对象编程的研究方向1993年1月。谷歌学者谷歌学者数字图书馆数字图书馆
  18. 菲利普·查尔斯(Philippe Charles)、克里斯托弗·多纳瓦(Christopher Donawa)、凯末尔·埃比奥卢(Kemal Ebcioglu。X10:一种面向对象的非均匀集群计算方法。第20届ACM SIGPLAN面向对象编程、系统、语言和应用年会会议记录2005年1月。谷歌学者谷歌学者数字图书馆数字图书馆
  19. M科尔。算法框架:并行计算的结构化管理。homepages.inf.ed.ac.uk,1989年1月。谷歌学者谷歌学者数字图书馆数字图书馆
  20. M科尔。出柜:一个实用的框架并行编程宣言。并行计算2004年1月。谷歌学者谷歌学者数字图书馆数字图书馆
  21. 郭敬聪(Guojing Cong)、斯里达尔·科达利(Sreedhar Kodali)、斯瑞拉姆·克里希纳莫奥斯蒂(Sriram Krishnamoorthy)、道格·李(Doug Lea)、维杰伊·萨拉斯瓦特(Vijay Saraswat)和童文(。使用自适应工作稳定解决大型不规则图形问题。2008年国际比较项目:2008年第37届并行处理国际会议记录,第536-545页,美国华盛顿特区,2008年。IEEE计算机学会。谷歌学者谷歌学者数字图书馆数字图书馆
  22. 弗雷德里卡·达雷马。SPMD模型:过去、现在和未来,并行虚拟机和消息传递接口的最新进展。第1卷,共页第八届欧洲PVM/MPI用户小组会议,第23-26页,2001年。谷歌学者谷歌学者数字图书馆数字图书馆
  23. J.Darlington、A.J.Field、P.G.Harrison、P.H.J.Kelly、D.W.N.Sharp、Q.Wu和R.L.While。使用骨架函数的并行编程。编辑A.Bode、M.Reeve和G.Wolf,93年巴黎:欧洲并行体系结构和语言,第146-160页。Springer-Verlag,德国柏林,1993年。谷歌学者谷歌学者数字图书馆数字图书馆
  24. J Darlington、Y Guo、H To和J Yang。结构化合成的平行骨架。第五届ACM SIGPLAN并行编程原理与实践研讨会1995年1月。谷歌学者谷歌学者数字图书馆数字图书馆
  25. 蒂莫西·戴维斯。佛罗里达大学稀疏矩阵集合,。佛罗里达大学技术报告,1998年。http://www.cise.uf.edu/research/sparese/matrixes/。谷歌学者谷歌学者
  26. 我是Foster、R Olson和S Tuecke。fortran m编程。osti.gov公司1993年1月。谷歌学者谷歌学者
  27. I Foster和S Taylor。Strand:一种实用的并行编程语言。北美逻辑程序设计会议, 2008.谷歌学者谷歌学者
  28. 伊恩·福斯特。组合并行编程语言。ACM编程语言与系统汇刊(TOPLAS1996年7月18日(4)。谷歌学者谷歌学者数字图书馆数字图书馆
  29. 马特奥·弗里戈(Matteo Frigo)、查尔斯·雷瑟森(Charles E.Leiserson)和基思·兰德尔(Keith H.Randall)。Cilk-5多线程语言的实现。ACM SIGPLAN’98编程语言设计和实现会议记录,第212-223页,加拿大魁北克省蒙特利尔,1998年6月。《ACM SIGPLAN通告》第33卷第5期(1998年5月)中公布的会议记录。谷歌学者谷歌学者数字图书馆数字图书馆
  30. 丹尼斯·甘农、彼得·贝克曼、伊丽莎白·约翰逊、托德·格林和迈克·莱文。HPC++和HPC++库工具包高性能C++联合体。谷歌学者谷歌学者
  31. 阿莫尔·戈廷(Amol Ghoting)、格雷戈里·布埃勒(Gregory Buehrer)、斯里尼瓦桑·帕塔萨拉西(Srinivasan Parthasarathy)、大云·金(Daehyun Kim)、安东尼·阮(Anthony Nguyen)、陈延光(Yen-Kuang Chen。现代和新兴处理器上的缓存感知频繁模式挖掘。VLDB杂志, 16(1):77--96, 2007.谷歌学者谷歌学者数字图书馆数字图书馆
  32. 托马斯·格罗斯(Thomas Gross)、大卫·奥哈拉龙(David R.O'Hallaron)和贾斯帕尔·苏布洛克(Jaspal Subhlok)。高性能Fortran框架中的任务并行性。IEEE并行分配技术。, 2(3):16--26, 1994.谷歌学者谷歌学者数字图书馆数字图书馆
  33. Yi Guo、Rajkishore Barik、Raghavan Raman和Vivek Sarkar。异步完成任务并行性的工作优先和帮助优先调度策略。第23届IEEE国际并行与分布式处理研讨会论文集(待发表)2009年5月。谷歌学者谷歌学者数字图书馆数字图书馆
  34. 安舒尔·古普塔。改进的非对称稀疏矩阵的符号分解和数值分解算法。SIAM矩阵分析与应用杂志, 24(2):529--552, 2002.谷歌学者谷歌学者数字图书馆数字图书馆
  35. 安舒尔·古普塔。WSMP:Watson稀疏矩阵包(第II部分:一般稀疏系统的直接解)。技术报告RC 21888,IBM T.J.Watson研究中心,纽约约克敦高地,2000年11月。网址:http://www.cs.umn.edu/~agupta/wsmp。谷歌学者谷歌学者
  36. Robert H.Halstead,Jr.MULTILISP:并发符号计算语言。ACM事务处理。程序。语言系统。, 7(4):501--538, 1985.谷歌学者谷歌学者数字图书馆数字图书馆
  37. Eric Juan、Jeffrey Tsai和Tadao Murata。使用基于petri网的凝聚规则对并发系统进行组合验证。ACM编程语言与系统汇刊(TOPLAS1998年9月20日(5)。谷歌学者谷歌学者数字图书馆数字图书馆
  38. Laxmikant V.Kale和Sanjeev Krishnan。Charm++:基于c.In的可移植并发面向对象系统面向对象编程系统、语言和应用会议论文集,第91-108页。ACM出版社,1993年。谷歌学者谷歌学者数字图书馆数字图书馆
  39. Prabhanjan Kambadur、Amol Ghoting、Anshul Gupta和Andrew Lumsdaine。为频繁模式挖掘扩展任务并行性。并行计算国际会议记录2009年9月,法国里昂。谷歌学者谷歌学者
  40. Prabhanjan Kambadur、Torsten Hoefler、Anshul Gupta和Andrew Lumsdaine。使用任务并行性的静态直接非循环图的需求驱动执行。高性能计算国际会议印度高知,2009年12月。谷歌学者谷歌学者
  41. 乔治·卡里皮斯和维平·库马尔。一种用于划分不规则图的快速高质量多级方案。SIAM科学计算杂志, 20:359--392, 1998.谷歌学者谷歌学者数字图书馆数字图书馆
  42. H库欣。骨架库。施普林格2002年1月。谷歌学者谷歌学者交叉引用交叉引用
  43. 乌尔里希·梅耶和彼得·桑德斯。Δ-stepping:一种可并行化的最短路径算法。J.算法, 49(1):114--152, 2003.谷歌学者谷歌学者数字图书馆数字图书馆
  44. 阿夫塔布·蒙西。OpenCL:GPU和CPU上的并行计算。2008年在图形和交互技术特别兴趣小组(SIGGRAPH)上的演讲。http://s08.idav.ucdavis.edu/munshi-opencl.pdf。谷歌学者谷歌学者
  45. OpenMP体系结构审查委员会。OpenMP应用程序接口,版本3.02008年5月。谷歌学者谷歌学者
  46. 詹姆斯·莱因德斯(James Reinders)。英特尔线程构件O'Reilly,2007年。谷歌学者谷歌学者数字图书馆数字图书馆
  47. 尤瑟夫·萨阿德。稀疏线性系统的迭代方法,第2版.SIAM,2003年。谷歌学者谷歌学者数字图书馆数字图书馆
  48. 拉里·塞勒(Larry Seiler)、道格·卡曼(Doug Carmen)、埃里克·斯普林格尔(Eric Sprangle)、汤姆·福赛斯(Tom Forsyth)、米歇尔·阿布拉什(Micheal Abrash)、普拉迪普·杜贝(Pradeep Dubey)、斯蒂芬·詹金斯(Stephen Jenkins)、亚当·莱克(Adam Lake。Larrabee:用于可视化计算的多核x86体系结构。ACM图形事务2008年8月27日(3)。谷歌学者谷歌学者数字图书馆数字图书馆
  49. Mohammed J Zaki、Srinivasan Parthasarathy、Mitsunori Ogihara和Wei Li。快速发现关联规则的新算法。技术报告,美国纽约州罗切斯特,1997年。谷歌学者谷歌学者数字图书馆数字图书馆

索引术语

  1. PFunc:现代高性能计算的现代任务并行

              建议

              评论

              登录选项

              检查您是否可以通过登录凭据或您的机构访问本文。

              登录

              完全访问权限

              • 发布于

                封面图片ACM会议
                SC’09:高性能计算网络、存储和分析会议记录
                2009年11月
                778页
                国际标准图书编号:9781605587448
                DOI(操作界面):10.1145/1654059

                版权所有©2009 ACM

                如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

                出版商

                计算机协会

                美国纽约州纽约市

                出版历史

                • 出版:2009年11月14日

                权限

                请求有关此文章的权限。

                请求权限

                检查更新

                限定符

                • 研究论文

                接受率

                2009年上半年纸张接受率59属于261提交,23%总体验收率1,516属于6,373提交,24%

              PDF格式

              以PDF文件的形式查看或下载。

              PDF格式

              电子阅读器

              使用eReader联机查看。

              电子阅读器