×

具有不可恢复中断的工作共享静态策略。 (英语) Zbl 1310.68047号

总结:一个人的工作负载很大,可以“分割”,其组成工作的粒度可以任意调整,并且可以访问远程工作计算机,以帮助计算工作负载。如何最好地利用工人?使这个问题复杂化的是,每个工人都会受到干扰(已知可能性),从而导致所有正在进行的工作都被打断。人们希望以最大化预期完成工作量的方式,协调与工人分担工作量。为了实现这一目标,我们提出了一些策略,即通过经常平衡对检查点的需求(从而减少任何时候易受攻击的工作量)与避免检查点所需的上下文切换的需求。时间表还必须缓和对复制工作的渴望,因为这样的复制会减少有效的远程劳动力。当前的研究表明,当只有一个工人时(p=1),以及当有两个工人时,至少在渐近意义上(p=2),策略的可及性可以证明最大化预期工作量;但这项研究强烈表明,(pgeq2)计算机的精确最大化很难实现,因为对多个工作人员的工作复制将检查点作为减少工作终止中断影响的手段。为了应对这一挑战,我们开发了高效的启发式方法,将检查点和工作复制作为减少工作终止中断影响的机制。通过使用理想模型和实际跟踪数据的详尽模拟,评估这些启发式算法在预期完成工作量中的质量。

MSC公司:

68平方米 计算机系统环境下的性能评估、排队和调度
68米15 网络和计算机系统的可靠性、测试和容错
87年第68季度 计算机科学中的概率(算法分析、随机结构、相变等)
PDF格式BibTeX公司 XML格式引用
全文: DOI程序 哈尔

参考文献:

[1] 安格拉诺,C。;布雷维克,J。;卡诺尼科,M。;努尔米,D。;Wolski,R.,《桌面网格上bag-of-task应用程序的故障感知调度》,56-63(2006),洛斯阿拉米托斯
[2] 阿尔帕奇,R.H。;阿联酋杜梭。;瓦达特,A.M。;Liu,L.T。;安德森,T.E。;Patterson,D.A.,《工作站网络上并行和顺序工作负载的交互》,267-278(1995),纽约
[3] Awerbuch,B。;阿扎尔,Y。;菲亚特,A。;Leighton,F.T.,《面对不确定性做出承诺:如何几乎每次都选择赢家》,519-530(1996)·Zbl 0922.68019号
[4] Beaumont,O.,Casanova,H.,Legrand,A.,Robert,Y.,Yang,Y.:在星形和树状网络上调度可分割负载:结果和开放问题。IEEE传输。平行配送系统。16(3), 207-218 (2005) ·doi:10.1109/TPDS.2005.35
[5] 医学硕士本德。;Phillips,C.A.,在异步处理器上调度DAG,35-45(2007)
[6] Benoit,A。;罗伯特·Y。;罗森博格,A.L。;Vivien,F.,《具有不可恢复中断的工作共享静态策略》(2009年),洛斯阿拉米托斯·Zbl 1310.68047号
[7] Benoit,A.,Robert,Y.,Rosenberg,A.L.,Vivien,F.:在无法恢复的中断下进行工作共享的静态策略。研究报告rr2010-18,LIP,ENS Lyon,法国(2010)。http://graal.ens-lyon.fr/yrobert/在线论文/RRLIP2010-18.pdf·Zbl 1310.68047号
[8] Benoit,A.,Robert,Y.,Rosenberg,A.L.,Vivien,F.:具有不可恢复中断的异构计算机的静态工作共享策略。并行计算。37(8), 365-378 (2011) ·Zbl 1225.68035号 ·doi:10.1016/j.parco.2010.03.001
[9] Bharadwaj,V.、Ghose,D.、Mani,V.和Robertazi,T.G.:在并行和分布式系统中调度可分割负载。Wiley/IEEE计算机学会出版社,纽约/洛斯阿拉米托斯(1996)
[10] Bhatt,S.N.,Chung,F.R.K.,Leighton,F.T.,Rosenberg,A.L.:工作站网络中偷自行车的最佳策略。IEEE传输。计算。46(5), 545-557 (1997) ·数字对象标识代码:10.1109/12.589220
[11] Buyya,R。;Abramson,D。;Giddy,J.,面向服务的网格计算经济网格架构案例(2001),洛斯阿拉米托斯
[12] 西尔内。;Marzullo,K.,《计算合作:将集群聚集到元计算机中》,160-166(1999)
[13] Foster,I.,Kesselman,C.(编辑):网格2:新计算基础设施蓝图。Morgan Kaufmann,圣马特奥(2004)
[14] Foster,I.、Kesselman,C.、Tuecke,S.:网格的剖析:支持可伸缩的虚拟组织。国际期刊高性能计算。申请。15(3), 200-222 (2001) ·doi:10.1177/10943420101500302
[15] Gallet,M.,Robert,Y.,Vivien,F.:关于“异构线性菊花链网络上多个负载的负载分配策略的设计和性能评估”的评论。J.平行分布计算。68(7), 1021-1031 (2008) ·Zbl 1243.68107号 ·doi:10.1016/j.jpdc.2007.12.002
[16] 加勒特,M。;罗伯特·Y。;Vivien,F.,可分割负荷调度(2009),伦敦/博卡拉顿
[17] Gao,L.,Malewicz,G.:努力最大化不可靠计算的依赖任务的结果质量。理论计算。系统。41(4), 731-752 (2007) ·Zbl 1148.68009号 ·doi:10.1007/s00224-006-1296-9
[18] Kondo,D.:在企业桌面网格上安排任务并行应用程序以实现快速周转。加州大学圣地亚哥分校博士论文(2005年)·Zbl 1225.68035号
[19] Kondo,D。;卡萨诺娃,H。;Wing,E。;Berman,F.,《全球计算应用程序的模型和调度机制》(2002)
[20] Korpela,E.,Werthimer,D.,Anderson,D.,Cobb,J.,Leboisky,M.:SETI@主页-SETI的大规模分布式计算。计算。科学。工程3(1),78-83(2001)·doi:10.1109/5992.895191
[21] M.J.利茨科夫。;利夫尼,M。;Mutka,M.W.,《秃鹰——空闲工作站的猎手》,104-111(1988)
[22] Malewicz,G.,Rosenberg,A.L.,Yurkewych,M.:基于互联网计算中调度DAG的理论。IEEE传输。计算。55(6), 757-768 (2006) ·doi:10.1109/TC.2006.91
[23] 努尔米,D。;布雷维克,J。;Wolski,R.,《企业和广域分布式计算环境中的机器可用性建模》,编号3648、432-441(2005)
[24] 普菲斯特,G.F.:《寻找集群》。普伦蒂斯·霍尔,纽约(1995年)·Zbl 0865.68003号
[25] 普朗克,J。;Elwasif,W.,工作站故障及其对检查点系统影响的实验评估,48-57(1998)·doi:10.1109/FTCS.1998.689454
[26] Rosenberg,A.L.:工作站网络中数据并行周期窃取指南i:最大化预期输出。J.平行分布计算。59(1), 31-53 (1999) ·doi:10.1006/jpdc.1999.1564
[27] Rosenberg,A.L.:工作站网络中数据并行周期窃取指南ii:保证输出最大化。发现的国际期刊。计算。科学。11(1), 183-204 (2000) ·Zbl 1319.68045号 ·doi:10.1142/S0129054100000107
[28] Rosenberg,A.L.:在工作负载为零散任务的工作站网络中,偷自行车的最佳时间表。IEEE传输。平行配送系统。13(2), 179-191 (2002) ·数字对象标识代码:10.1109/71.983945
[29] 罗森博格,A.L。;Zomaya,A.(编辑),《协作算法的挑战变化》,1-44(2006),柏林·doi:10.1007/0-387-27705-6_1
[30] 白色,S。;Torney,D.,使用工作站集群进行染色体物理绘图,14-17(1993)
[31] Wingstrom,J。;Casanova,H.,桌面网格上任务的概率分配(2008),洛斯阿拉米托斯
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。