×

分布式共享存储系统上开发和调试并行程序的数据竞争避免和重放方案。 (英语) Zbl 1211.68068号

摘要:分布式共享内存(DSM)通过模拟全局虚拟共享内存,允许并行程序在分布式计算机上运行,但当多线程进程的线程并发访问物理分布式内存时,很容易出现数据竞赛错误。早期用于帮助程序员定位非DSM并行程序中的数据竞赛错误的工具并不容易应用于DSM系统。本研究提出了数据竞争避免和重放方案(DRARS),以帮助在DSM或多核系统上调试并行程序。DRARS是一种新颖的工具,它控制目标程序的一致性协议,在并行程序随后运行时自动防止大量数据竞赛错误,从而避免了大量手动调试的需要。对于无法自动避免的数据竞赛错误,DRARS在DSM系统上执行确定性重播类型的功能,忠实地再现并行程序在运行时的行为。因为已经消除了一类数据竞赛错误,所以剩余的手动调试任务大大简化。与以前的调试方法不同,DRARS不要求用特定的风格或编程语言编写并行程序。此外,DRARS可以在大多数一致性协议中实现。本文在具有各种应用的DSM系统上,使用紧急发布一致性协议实现并在实际实验中验证了DRARS。

MSC公司:

68甲19 其他编程范式(面向对象、顺序、并发、自动等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 李凯;Paul Hudak:共享虚拟内存系统中的内存一致性,计算机系统上的ACM事务7,321-359(1989)
[2] Chang,J.B。;谢赫,C.K。;Liang,T.Y.:集群对称多处理器的透明分布式共享内存,《超级计算杂志》37,145-160(2006)
[3] Alokika Dash,Brian Demsky,软件事务分布式共享内存,摘自:2009年北卡罗来纳州罗利市第14届ACM SIGPLAN并行编程原理与实践研讨会论文集。
[4] 阿卜杜勒法塔·阿雷夫·叶海亚;Bader,Rana Mohamad Idrees:分布式共享内存一致性基于对象的模型,《计算机科学杂志》3,57-61(2007)
[5] 格罗普,W。;Lusk,E。;剂量,N。;Skjellum,A.:MPI消息传递接口标准的高性能可移植实现,并行计算22,789-828(1996)·Zbl 0875.68206号 ·doi:10.1016/0167-8191(96)00024-5
[6] 迪马蒂诺,贝尼亚米诺;Dieter Kranzlmuller;Jack Dongarra:专题:网格计算和消息传递接口,未来一代计算机系统24,119-120(2008)
[7] Pete Keleher、Alan L.Cox、Sandhya Dwarkadas、Hya Dwarkadas、Willy Zwaenepoel、TreadMarks:标准工作站和操作系统上的分布式共享内存,收录于:《1994年冬季Usenix会议论文集》,加利福尼亚州旧金山,1994年。
[8] 约翰·卡特(John B.Carter)。;约翰·贝内特(John K.Bennett)。;Zwaenepoel,Willy:分布式共享存储系统中减少一致性相关通信的技术,计算机系统上的ACM事务13,205-243(1995)
[9] A.S.Tannebaum,《分布式操作系统》,Prentice-Hall,Englewood Cliffs,NJ,1995年。
[10] Frank Mueller,分布式共享内存线程:DSM-threads,摘自:并行编程运行时系统研讨会,瑞士日内瓦,1997年。
[11] 《网格:新计算基础设施蓝图》(1999年)
[12] 于佳;Buyya,Rajkumar:网格计算工作流管理系统分类,网格计算杂志3171-200(2005)
[13] Weiss,A.:《云计算》,Networker 11,16-25(2007)
[14] 拉吉库马尔·布亚;Yeo,Chee Shin;Venugopal,Srikumar:面向市场的云计算:作为计算工具交付IT服务的愿景、炒作和现实,《未来一代计算机系统》25,599-616(2009)
[15] 萨维奇,S。;伯罗斯,M。;纳尔逊,G。;Sobalvarro,P。;Anderson,T.:橡皮擦:多线程程序的动态数据竞争检测器,计算机系统上的ACM事务15,391-411(1997)
[16] R.Stallman,R.Pesch,用GDB调试,GNU源代码级调试程序,自由软件基金会,波士顿,1993年。
[17] D.Engler,K.Ashcraft,RacerX:比赛条件和僵局的有效、静态检测,载于:第19届美国计算机学会操作系统原理研讨会论文集,Bolton Landing,纽约,2003年。
[18] T.Henzinger,R.Jhala,R.Majumder,通过上下文推理进行种族检查,收录于:ACM SIGPLAN编程语言设计与实现会议论文集,华盛顿特区,美国,2004年。
[19] N.Sterling,Warlock:一种静态数据竞赛分析工具,收录于:USENIX冬季技术会议论文集,美国加利福尼亚州圣地亚哥,1993年。
[20] S.Adve,M.Hill,B.Miller,R.Netzer,《检测弱内存系统上的数据竞争》,载于:加拿大安大略省多伦多市第18届计算机体系结构国际研讨会论文集,1991年。
[21] Choi,J。;米勒,B。;Netzer,R.:使用回流分析调试并行程序的技术,编程语言和系统上的ACM事务13,491-530(1991)
[22] M.Christiaens,K.Brosschere,TRaDe,《Java程序中实时比赛检测的拓扑方法》,收录于:《第一届Java虚拟机研究与技术研讨会论文集》,美国加利福尼亚州蒙特雷,2001年。
[23] A.Dinning,E.Schonberg,《访问异常检测监控算法的实证比较》,载于《第二届ACM SIGPLAN并行编程原理与实践研讨会论文集》,美国华盛顿州西雅图,1990年。
[24] J.Mellor-Crummey,具有嵌套fork-join并行性的程序数据竞争的实时检测,载于《第四届超级计算年会论文集》,新墨西哥州阿尔伯克基,1991年。
[25] Ronsse,M。;Bosschere,K.:重播:一个完全集成的实用记录/重播系统,计算机系统上的ACM事务17,133-152(1999)
[26] E.Schonberg,访问异常的实时检测,摘自:《ACM SIGPLAN编程语言设计与实现会议论文集》,俄勒冈州波特兰,1989年。
[27] R.Agarwal,A.Sasturkar,L.Wang,S.Stoller,使用部分发现类型优化运行时竞争检测和原子性检查,收录于:第20届IEEE/ACM自动化软件工程国际会议论文集,美国加利福尼亚州长滩,2005年。
[28] H.Nishiyama,使用基于读屏障的动态逃逸分析检测数据竞赛,载于:第三届虚拟机研究与技术研讨会论文集,美国加利福尼亚州圣何塞,2004年。
[29] C.von Praun,T.Gross,《对象种族检测:面向对象编程、系统、语言和应用的ACM SIGPLAN会议进程》,美国佛罗里达州坦帕湾,2001年。
[30] C.von Praun,T.Gross,多线程面向对象程序的静态冲突分析,收录于:《ACM SIGPLAN编程语言设计与实现会议论文集》,美国加利福尼亚州圣地亚哥,2003年。
[31] J.Choi,K.Lee,A.Loginov,R.O'Callahan,V.Sarkar,M.Sridharan,《多线程面向对象程序的高效和精确数据竞争检测》,载于《ACM SIGPLAN编程语言设计与实现会议论文集》,德国柏林,2002年。
[32] Satish Narayanasamy、Gilles Pokam、Brad Calder、Bugnet:连续记录确定性回放调试的程序执行,收录于:第32届计算机体系结构国际研讨会论文集,美国威斯康星州麦迪逊,2005年。
[33] Frank Cornelis、Michiel Ronsse、Koen De Bosschere、Tornado:一种新型输入重放工具,收录于:《并行和分布式处理技术及应用国际会议论文集》,美国内华达州拉斯维加斯,2003年。
[34] Daniel J.Sorin、Milo M.K.Martin、Mark D.Hill、David A.Wood,《安全网:通过全局检查点/恢复提高共享内存多处理器的可用性》,载于:《第29届计算机体系结构国际研讨会论文集》,阿拉斯加安克雷奇,2002年。
[35] Leblanc,T.J。;Mellor-Crummey,J.M.:用即时回放调试并行程序,计算机上的IEEE事务36,471-482(1987)
[36] J.Choi,H.Srinivasan,《Java多线程应用程序的确定性重播》,载于《SIGMETRICS并行和分布式工具研讨会论文集》,美国俄勒冈州韦尔奇,1998年。
[37] M.Ronsse,W.Zwaenepoel,《胎面花纹的执行回放》,载于《欧洲显微并行和分布式处理研讨会论文集》,英国伦敦,1997年。
[38] 兰波特,L。;时间;时钟:分布式系统中事件的排序,ACM通信21,558-565(1978)·Zbl 0378.68027号 ·doi:10.1145/359545.359563
[39] T.Y.Liang,C.Y.Wu,J.B.Chang,C.K.Shieh,Teamster-G:一个支持网格的软件DSM系统,摘自:第五届IEEE集群计算和网格研讨会论文集,英国加的夫,2005年。
[40] Cristiana Amza、Alan L.Cox、Willy Zwaenepoel、Sandhya Dwarkadas,《适用于单写器和多写器的软件DSM协议》,收录于:第三届IEEE高性能计算机体系结构研讨会论文集,美国德克萨斯州圣安东尼奥,1997年。
[41] John B.Carter、John K.Bennett、Willy Zwaenepoel,《Munin的实现和性能》,载于《第13届ACM操作系统原理研讨会论文集》,加利福尼亚州太平洋格罗夫,美国,1991年。
[42] Silva,L.M。;席尔瓦,J.G。;Chappl,S.:《DSMPI的实施和性能》,科学规划杂志6,201-214(1997)
[43] H.Harada,Y.Ishikawa,A.Hori,H.Tezuka,S.Sumimoto,T.Takahashi,《软件分布式共享内存上的动态家庭节点重新分配》,载于:《HPC亚洲2000年会议论文集》,中国北京,2000年。
[44] B.Wilkinson,M.Allen,《并行编程:使用网络工作站和并行计算机的技术和应用》,Prentice Hall,Upper Saddle River,NJ,美国,1999年。
[45] Steven Cameron Woo、Moriyoshi Ohara、Evan Torrie、Jaswinder Pal Singh、Anoop Gupta,《SPLASH-2程序:特征化和方法论考虑》,载于:《第22届计算机体系结构国际研讨会论文集》,S.Margherita Ligure,意大利,1995年。
[46] David H.Bailey:《外部或分层存储器中的Fft’s》,《超级计算杂志》4,23-35(1990)
[47] 佩特根,H.O。;Jurgens,H。;Saupe,D.:《混沌与分形:科学的新前沿》(1992)·Zbl 0779.58004号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。