×

一种用于大规模可靠分布式系统资源管理的动态调度算法。 (英语) Zbl 1247.90161号

摘要:在大规模异构环境中运行分布式应用程序的情况下,调度是性能保证的关键组件。该系统中调度器的另一个功能是实现弹性机制,以应对可能的故障。在这种情况下,最好使用专用的重新安排机制来实现弹性。在大规模分布式系统和动态行为的背景下,重调度的性能非常重要。本文提出了一种通用的重调度算法。该算法可以使用多种调度启发式,用户可以根据系统的结构提前选择。重新调度组件被设计为一个中间件服务,旨在提高大规模分布式系统的可靠性。该系统在网格系统的实际实现中进行了评估。该方法支持容错,并提供了改进的资源管理机制。使用建模和仿真对所提出的重新调度算法进行了评估。我们给出的实验结果证实了所提出的重调度算法的性能和能力。

MSC公司:

90B35型 运筹学中的确定性调度理论
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 阿维齐尼斯,A。;J.-C.拉普利。;Randell,B。;Landwehr,C.,可靠和安全计算的基本概念和分类,IEEE Trans。可靠安全计算。,1,1,11-33(2004年)
[2] Xhafa,F。;Abraham,A.,网格调度问题的计算模型和启发式方法,未来世代。计算。系统。,26, 4, 608-621 (2010)
[3] Christodoulopoulos,K。;苏拉斯,V。;I.姆帕科拉斯。;Varvarigos,E.,网格网络中计算和通信任务的集中式和分布式元调度体系结构的比较,计算。社区。,32, 7-10, 1172-1184 (2009)
[4] 波普·F。;Dobre,C。;Cristea,V.,使用MONARC仿真工具对网格DAG调度算法进行性能分析,(ISPDC’08:2008年并行和分布式计算国际研讨会论文集(2008),IEEE计算机学会:IEEE计算机协会,美国华盛顿特区),131-138
[5] Xhafa,F。;Ajith,A.,《计算网格中调度的启发式方法简编》(IDEAL’09:第十届智能数据工程和自动学习国际会议论文集(2009),斯普林格·弗拉格:斯普林格尔·弗拉格柏林,海德堡),751-758,978-3-642-04393-2
[6] Sakellariou,R。;Zhao,H.,网格系统上高效映射工作流的低成本重新调度策略,科学。掠夺。,12, 4, 253-262 (2004)
[7] 伯曼,F。;卡萨诺娃,H。;Chien,A。;库珀,K。;Dail,H。;Dasgupta,A。;邓,W。;Dongarra,J。;Johnsson,L。;肯尼迪,K。;科尔贝尔,C。;刘,B。;刘,X。;曼达尔,A。;马林·G。;Mazina,M。;Mellor-Crummey,J。;门德斯,C。;奥卢比尔,A。;帕特尔,J.M。;里德·D。;施,Z。;西弗特,O。;夏,H。;YarKhan,A.,GrADS项目中的新电网调度和重新调度方法,国际J.并行程序。,33, 2, 209-229 (2005)
[8] Xhafa,F。;Carretero,J。;巴罗利,L。;Durresi,A.,网格系统中的即时模式调度,Int.J.Web grid Serv。,3, 2, 219-236 (2007)
[9] Xhafa,F。;巴罗利,L。;Durresi,A.,网格系统中的批处理模式调度,Int.J.Web grid Serv。,3, 1, 19-37 (2007)
[10] Benoit,A。;Hakem,M。;Robert,Y.,异构系统中优先级约束任务的竞争感知和容错调度,并行计算。,35, 2, 83-108 (2009)
[11] 埃尔南德斯,I。;Cole,M.,《DAG应用的无功电网调度》,(PDCN'07:第25届IASTED国际多方会议会议记录(2007),ACTA出版社:美国加利福尼亚州阿纳海姆ACTA出版社),92-97
[12] 埃尔南德斯,I。;Cole,M.,《具有倒带和迁移功能的网格上的可靠DAG调度》(GridNets’07:第一届网格应用网络国际会议论文集(2007),ICST(计算机科学、社会信息和电信工程研究所):ICST(计算机科学、社会信息学和电信工程研究所)ICST,比利时布鲁塞尔),1-8
[13] 医学硕士本德。;Phillips,C.A.,在异步处理器上调度DAG,(SPAA’07:第十九届ACM并行算法和架构年会论文集(2007),ACM:美国纽约州纽约市ACM),35-45
[14] 班萨尔,S。;库马尔,P。;Singh,K.,分布式存储机器中任务和数据并行调度的改进两步算法,并行计算。,32, 10, 759-774 (2006)
[15] Jin,S。;Schiavone,G。;Turgut,D.,《多处理机任务调度算法的性能研究》,J.Supercomput。,43,1,77-97(2008)
[16] A.甘地。;Akkary,H。;Rajwar,R。;Srinivasan,S.T。;Lai,K.,延迟容忍处理器中的可伸缩加载和存储处理,(ISCA 05:第32届计算机体系结构国际研讨会论文集(2005),IEEE计算机学会:IEEE计算机协会,华盛顿特区,美国),446-457
[17] Lee,Y.C。;Zomaya,A.Y.,《在云的支持下重新安排可靠的工作完成时间》,《未来一代》。计算。系统。,26, 1192-1199 (2010)
[18] Antony Lidya Therasa,S。;苏马蒂,G。;Antony Dalya,S.,网格计算中检查点的动态自适应和重新调度,国际计算杂志。申请。,2,3195-99(2010),计算机科学基金会出版
[19] Maheswaran,M。;阿里,S。;西格尔·H·J。;Hensgen,D。;Freund,R.F.,一类独立任务到异构计算系统的动态映射,J.并行分布计算。,59, 107-131 (1999)
[20] 郭永康。;Ahmad,I.,将定向任务图分配给多处理器的静态调度算法,ACM Compute。调查。,31, 406-471 (1999)
[21] Ullman,J.D.,NP-完全调度问题,J.Compute。系统科学。,10, 384-393 (1975) ·Zbl 0313.68054号
[22] Sinnen,O。;Sousa,L.,《任务调度准确性:评估方法和结果》,超级计算杂志。,27, 177-194 (2004) ·Zbl 1101.68429号
[23] 罗格朗,I.C。;Newman,H.B.,用于模拟大型网络分布式处理系统的MONARC工具集,(WSC'00:第32届冬季模拟会议论文集(2000),国际计算机模拟学会:国际计算机模拟协会,美国加利福尼亚州圣地亚哥),1794-1801
[24] Dobre,C。;Stratan,C。;Cristea,V.,《使用监控实现大规模分布式系统的现实仿真》,(ISPDC’08:2008年并行和分布式计算国际研讨会论文集(2008),IEEE计算机学会:IEEE计算机协会,美国华盛顿特区),434-438
[25] Dobre,C。;波普·F。;Cristea,V.,《面向大规模分布式系统的可扩展模拟》,(NBIS’09:2009年基于网络的信息系统国际会议论文集(2009),IEEE计算机学会:IEEE计算机协会,华盛顿特区,美国),103-108
[26] Cho,B。;Youn,H。;Lee,E.,《基于可靠性和可用性的性能分析方法》(ICHIT’09:2009年混合信息技术国际会议论文集,ACM:美国纽约州纽约市ACM),401-407
[27] 多布雷,C。;波普·F。;克里斯蒂·V。;Kolodziej,J.,可靠分布式系统的高级仿真模型,(第25届欧洲建模与仿真会议,第25届建模与仿真欧洲会议,ECMS 2011(2011),IEEE计算机学会:IEEE计算机协会,华盛顿特区,美国),511-517
[28] 科斯坦,A。;Dobre,C。;克里斯蒂·V。;Voicu,R.,《大规模分布式协作中高速网络的监控体系结构》,(ISPDC’08:2008年并行和分布式计算国际研讨会论文集(2008),IEEE计算机学会:IEEE计算机协会,美国华盛顿特区),409-416
[29] Orozco,D。;加西亚,E。;Gao,G.,使用数据依赖图对模板应用程序进行位置优化,(第23届并行计算语言和编译器国际会议论文集。第23届平行计算语言和编译程序国际会议论文录,LCPC'10(2011),Springer-Verlag:Springer-Verlag Berlin,海德堡),77-91,网址:http://dl.acm.org/citation.cfm?id=1964536.1964542
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。