×

多维稠密数组上并行计算的微积分。 (英语) Zbl 1112.68058号

摘要:我们提出了一种微积分,用于形式化多维密集阵列上的并行计算,并给出了并行计算的成本。该演算通过计算和数据收集扩展了一个简单的分布演算(在以前的一些工作中提出)。我们考虑一个SPMD编程模型,在该模型中,可以使用点到点以及集合操作进行进程交互,这在很大程度上是MPI风格的。我们想严格描述在密集阵列上工作的数据并行应用程序的所有阶段:在一组处理器上的阵列的初始分布(即分区和复制)、分布式数据的并行计算、中间结果的交换和最终数据收集。在本文中,除了定义微积分外,我们还给出了它一个形式化语义,证明了不同操作组合之间的方程,并说明了如何将成本与操作组合相关联。最后一个特性使得可以在语义等效的实现策略之间进行定量的成本驱动选择。

MSC公司:

2010年第68季度 计算模式(非确定性、并行、交互式、概率性等)

软件:

线性代数库
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Choi,J。;Dongarra,J。;波佐,R。;Walker,D.,ScaLAPACK:分布式内存并发计算机的可扩展线性代数库,(第四届大规模并行计算前沿研讨会论文集,弗吉尼亚州麦克莱恩(1992),IEEE计算机学会出版社:IEEE计算机社会出版社,马里兰州银泉),120-127
[2] Casanova H,Dongarra J.Netsolve:用于解决计算科学问题的网络服务器。田纳西大学技术报告;1996.; Casanova H,Dongarra J.Netsolve:用于解决计算科学问题的网络服务器。田纳西大学技术报告;1996
[3] Sekiguchi,S。;佐藤,M。;Nakada,H。;松冈,S。;Nagashima,U.,Ninf:全球高性能计算的基于网络的信息库(并行面向对象方法和应用程序(POOMA),圣菲(1996))
[4] Danalotto M,Pasqualetti F,Pelagatti S.《P3L数据并行框架》。载于:《欧洲议会议事录》,1997年,德国帕索。计算机科学课堂讲稿,第1300卷。柏林:施普林格;1977年,第619-28页。;Danalotto M,Pasqualetti F,Pelagatti S.《P3L数据并行框架》。摘自:《1997年欧洲-太平洋地区会议记录》,德国帕绍。计算机科学课堂讲稿,第1300卷。柏林:施普林格;1977年,第619-28页·Zbl 0996.68840号
[5] Danalotto M,Di Cosmo Ri,Leroy X,Pelagatti S。骨架并行函数编程:OcamlP3l实验,ML研讨会,巴尔的摩,1998年。;Danalotto M,Di Cosmo Ri,Leroy X,Pelagatti S。骨架并行函数编程:OcamlP3l实验,ML研讨会,巴尔的摩,1998年。
[6] Quinn,M.,《并行计算:理论与实践》(1994),McGraw-Hill:McGraw-Hill纽约
[7] Di Cosmo,R。;Pelagatti,S.,密集数组分布的微积分,并行处理快报,13,377-388(2003)
[8] Xi,H。;Pfenning,F.,《实际编程中的依赖类型》(POPL 99-第26届ACM SIGPLAN-SIGACT编程语言原理研讨会会议记录,德克萨斯州圣安东尼奥,纽约州纽约市(1999)),214-227
[9] Bird R.构造函数编程讲座。在:计算机科学中的构造方法。北约ASI,第F-55卷。柏林:施普林格;1989年,第151-216页。;Bird R.构造函数编程讲座。在:计算机科学中的构造方法。北约ASI,第F-55卷。柏林:施普林格;1989年,第151-216页。
[10] Gorlatch,S。;韦德勒,C。;Lengauer,C.,《使用集合运算进行编程的优化规则》(第13届国际并行处理研讨会和第10届并行和分布式处理研讨会(IPPS/SDP'99)(1999)),492-499
[11] Mosses PD,《理论计算机科学手册》,第B卷,马萨诸塞州剑桥:麻省理工学院出版社;1991.【指称语义学】。;Mosses PD,《理论计算机科学手册》,第B卷,马萨诸塞州剑桥:麻省理工学院出版社;1991.【指称语义】。
[12] OcamlP3l系统地图骨架的高效实现。DEA报告,巴黎第七大学;2003年7月。;OcamlP3l系统地图骨架的高效实现。DEA报告,巴黎第七大学;2003年7月。
[13] Skillicorn,D.B。;希尔,J.M.D。;McColl,W.F.,《关于bsp的问答》,科学规划,6,3,249-274(1997)
[14] 里德,J。;Parrot,K。;Lanfear,T.,并行计算的可移植性、可预测性和性能:实践中的BSP,并发:实践和经验,8,10,799-812(1996)
[15] Hill J,Donaldson S,Skillicorn D。实际通信性能的稳定性:从cray t3e到工作站网络。技术报告PRG-TR-33-97,牛津大学计算实验室;1997年10月。;Hill J,Donaldson S,Skillicorn D。实际通信性能的稳定性:从cray t3e到工作站网络。技术报告PRG-TR-33-97,牛津大学计算实验室;1997年10月。
[16] 希尔·JMD。牛津BSP工具集中的集体通信,注释,部分;希尔·JMD。牛津BSP工具集中的集体通信,注释
[17] 罗达·J。;罗德里格斯,C。;莫拉莱斯,D。;Almeida,F.,预测消息传递模型的执行时间,并发:实践与经验,11,9,461-477(1999)
[18] 罗德里格斯,C。;罗达·J。;Sande,F。;莫拉莱斯,D。;Almeida,F.,异步算法分析的新并行模型,并行计算,26753-767(2000)·Zbl 0945.68068号
[19] Foster,I.,《设计和构建并行程序》(1995),Addison-Wesley:Addison-Whesley Reading,MA·Zbl 0844.68040号
[20] 培根,D。;Graham,S。;Sharp,O.,《高性能计算的编译器转换》,ACM computing Surveys,26,4,354-420(1994)
[21] 维奥拉德,E。;Genaud,S。;Perrin,G.-R.,《PEI中数据并行程序的优化》,(Bird,R.;Meertens,L.,IFIP算法语言和计算工作会议(1997),查普曼和霍尔:查普曼&霍尔伦敦)
[22] Südholt,M.,数据分布代数:使用骨架编程的形式基础,(Olderog,E.-R.,编程概念、方法和演算(PROCOMET'94)(1994),北荷兰:北荷兰阿姆斯特丹),19-38
[23] 陈,M。;Choo,Y。;Li,J.,Crystal:生成高效并行代码的理论和语用学,(Szymanski,B.,《并行函数语言和编译器》(1991),边疆系列,ACM出版社:边疆系列(纽约ACM出版社),255-308,[第7章]
[24] Lechtchinsky,R。;查克拉瓦蒂,M。;Keller,G.,《成本核算嵌套数组代码》,《并行处理快报》,12,2,249-266(2002)
[25] Misra,J.,《Powerlist:并行递归的结构》,《编程语言和系统的ACM事务》,16,6,1737-1767(1994)
[26] Jay C,Cole M,Sekanina M,Steckler P.数组函数语言并行成本计算的一元微积分,收录于:Lengauer C,Griebl M,Gorlatch S,editors。1997年欧洲标准并行处理会议记录,计算机科学讲义,第1300卷。柏林:施普林格;1997年,第650-61页。;Jay C,Cole M,Sekanina M,Steckler P.数组函数语言并行成本计算的一元微积分,收录于:Lengauer C,Griebl M,Gorlatch S,editors。《1997年欧洲-保时捷并行处理会议录》,计算机科学讲义,第1300卷。柏林:施普林格;1997年,第650-61页·Zbl 0996.68836号
[27] 芬克,S。;科恩,S。;Baden,S.,《不规则块结构应用程序的高效运行时支持》,《并行与分布式计算杂志》,50,1-2,61-68(1998)·Zbl 0910.68030号
[28] Feautrier P.多面体模型中的自动并行化。收件人:Perrin G-R,Darte A,编辑。数据并行编程模型。计算机科学课堂讲稿,第1132卷。柏林:施普林格;1996年,第79-103页。;Feautrier P.多面体模型中的自动并行化。收件人:Perrin G-R,Darte A,编辑。数据并行编程模型。计算机科学课堂讲稿,第1132卷。柏林:施普林格;1996年,第79-103页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。