×

具有组通信的动态负载平衡。 (英语) Zbl 1140.68070号

摘要:这项工作考虑了在网络进行动态重新配置(包括分区和合并)的情况下,使用处理器网络高效执行一组任务的问题。此设置的一个关键挑战是实现动态负载平衡,以减少由于重新配置而冗余执行的任务数量。我们探索了动态网络中负载平衡的新方法,可供使用组通信服务(GCS)的应用程序使用。我们考虑的GCS包括会员服务(建立新组以反映动态变化),但不包括主要组件的维护。对于本文定义的处理器、任务负载平衡问题,得到了以下具体结果。对于包括分段和合并在内的完全动态变化的情况,我们证明了任何在线任务分配算法的终止时间都大于离线任务分配算法终止时间的一个因子,该因子大于\(n/12\)。我们提出了一种负载平衡算法,该算法保证在存在f个碎片失败的情况下,由工作为(O(n+f\cdot n)的分区引起的所有碎片中的所有任务都能完成。我们开发了一种有效的调度策略来最小化任务执行冗余,并证明了我们的策略为n个处理器中的每一个处理器提供了一个任务调度,使得最多一个任务由任意两个处理器冗余执行。

MSC公司:

68宽15 分布式算法
68平方米 计算机系统环境下的性能评估、排队和调度
90B18号机组 运筹学中的通信网络

软件:

荷鲁斯
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Babaoglu,O。;达沃利,R。;Montresor,A.,《可分区异步分布式系统中的组成员和视图同步:规范》,《操作系统版本》,31,2,11-22(1997)
[2] O.Babaoglu,R.Davoli,A.Montresor,R.Segala,分区软件网络应用的系统支持,见:Proc。第18届国际米兰。分布式计算系统会议,1998年5月。;O.Babaoglu,R.Davoli,A.Montresor,R.Segala,分区软件网络应用的系统支持,见:Proc。第18届国际米兰。分布式计算系统会议,1998年5月。
[3] 伯曼,K.P。;van Renesse,R.,使用isis工具包的可靠分布式计算(1994),IEEE计算机学会出版社:IEEE计算机学会出版社,加利福尼亚州洛斯阿拉米托斯
[4] K.P.Birman,《可靠组播经验综述》,《软件实践与经验》,第29卷(9),威利,纽约,1999年,第741-774页。;K.P.Birman,《可靠多播经验综述》,《软件实践与经验》,第29卷(9),威利,纽约,1999年,第741-774页。
[5] Chlebus,B.S。;De Prisco,R。;Shvartsman,A.A.,在同步可重启消息传递处理器上执行任务,分布式计算。,14, 49-64 (2001) ·Zbl 1448.68083号
[6] 美国通信管理委员会,《集团通信服务专刊》,39(4)1996年。;ACM通信,《集团通信服务特刊》,第39(4)期,1996年。
[7] R.De Prisco,A.Fekete,N.Lynch,A.Shvartsman,一种面向动态视图的群组通信服务,在:Proc。ACM交响乐团。《分布式计算原理》,1998年。;R.De Prisco,A.Fekete,N.Lynch,A.Shvartsman,《面向动态视图的群组通信服务》,摘自:Proc。ACM交响乐团。《分布式计算原理》,1998年。
[8] R.De Prisco、A.Mayer、M.Yung,《故障情况下的时间最优信息效率工作表现》,摘自:Proc。第13届ACM交响乐团。《分布式计算原理》,1994年,第161-172页。;R.De Prisco、A.Mayer、M.Yung,《故障情况下的时间最优信息效率工作表现》,摘自:Proc。第13届ACM交响乐团。《分布式计算原理》,1994年,第161-172页·Zbl 1373.68090号
[9] 多列夫,D。;Malki,D.,transis高可用性集群通信方法,通信ACM,39,4,64-70(1996)
[10] C.Dwork,J.Halpern,O.Waarts,《在故障情况下高效工作》,SIAM J.Computing,27(5)(1998)1457-1491;初步版本显示为在出现故障的情况下完成工作,见:Proc。第11届ACM交响乐团。《分布式计算原理》,1992年,第91-102页。;C.Dwork,J.Halpern,O.Waarts,《在故障情况下高效工作》,SIAM J.Computing,27(5)(1998)1457-1491;初步版本显示为在出现故障的情况下完成工作,见:Proc。第11届ACM交响乐团。《分布式计算原理》,1992年,第91-102页·Zbl 0907.68099号
[11] P.Ezhilchelvan,R.Macedo,S.Shrivastava,Newtop:容错组通信协议,见:Proc。IEEE国际。分布式计算系统会议,1995年,第296-306页。;P.Ezhilchelvan,R.Macedo,S.Shrivastava,Newtop:容错组通信协议,见:Proc。IEEE国际。分布式计算系统会议,1995年,第296-306页。
[12] A.Fekete,R.Khazan,N.Lynch,《作为负载平衡、复制数据服务基础的集团通信》,载于:Proc。第12届国际米兰。交响乐团。《分布式计算》,1998年。;A.Fekete,R.Khazan,N.Lynch,《作为负载平衡、复制数据服务基础的集团通信》,摘自:Proc。第12届国际米兰。交响乐团。分布式计算,1998年。
[13] Fekete,A。;林奇,N。;Shvartsman,A.,《指定和使用可分区组通信服务》,ACM Trans。计算。系统,19,2171-216(2001)
[14] Z.Galil,A.Mayer,M.Yung,《解决拜占庭协议及其后的信息复杂性》,载于:Proc。第36届IEEE交响曲。《计算机科学基础》,1995年,第724-733页。;Z.Galil,A.Mayer,M.Yung,解决拜占庭协议及其以外的信息复杂性,见:Proc。第36届IEEE交响曲。《计算机科学基础》,1995年,第724-733页·Zbl 0938.68658号
[15] Ch.Georgiou,《量化逆境下的协同分布式计算》,康涅狄格大学博士论文,2003年。;Ch.Georgiou,《量化逆境下的协同分布式计算》,康涅狄格大学博士论文,2003年。
[16] Ch.Georgiou,A.Russell,A.A.Shvartsman,《带崩溃的同步迭代do-all的复杂性》,摘自:Proc。第15届国际。交响乐团。分布式计算(DISC’01),2001年,Springer,计算机科学讲义,第2180卷,第151-165页。;Ch.Georgiou,A.Russell,A.A.Shvartsman,《带崩溃的同步迭代do-all的复杂性》,摘自:Proc。第15届国际。交响乐团。分布式计算(DISC’01),2001年,Springer,计算机科学讲义,第2180卷,第151-165页·Zbl 1024.68512号
[17] Ch.乔治奥。;Shvartsman,A.A.,《可分裂群和可合并群的协同计算》,《离散算法》,第1、2、211-235页(2003年)·Zbl 1073.68096号
[18] Ch.乔治奥。;罗素(A.Russell)。;Shvartsman,A.,《动态组协同计算的工作竞争调度》,SIAM J.Compute。(SICOMP),34、4、848-862(2005)·Zbl 1075.68098号
[19] M.Hayden,《集成系统》,康奈尔大学计算机科学博士论文,1998年。;M.Hayden,集成系统,博士论文,计算机科学,康奈尔大学,1998年。
[20] Kanellakis,P。;Shvartsman,A.,容错并行计算(1997),Kluwer学术出版社:Kluwer-学术出版社,马萨诸塞州Dordrecht·Zbl 0881.68050号
[21] E.Y.Lotem,I.Keidar,D.Dolev,《一致主要组件的动态投票》,摘自:Proc。ACM交响乐团(Ann 16)。《分布式计算原理》,1997,63-71。;E.Y.Lotem,I.Keidar,D.Dolev,《一致主要组件的动态投票》,摘自:Proc。ACM交响乐团(Ann 16)。《分布式计算原理》,1997,63-71·Zbl 1373.68091号
[22] 北卡罗来纳州林奇。;Tuttle,M.R.,《输入/输出自动机简介》,CWI Quarterly,2,3,219-246(1989)·Zbl 0677.68067号
[23] G.Malewicz,Distributed scheduling for disconnected cooperation,康涅狄格大学博士论文,2003。;G.Malewicz,《断开合作的分布式调度》,康涅狄格大学博士论文,2003年·兹比尔1266.68058
[24] G.Malewicz,A.Russell,A.Shvartsman,《缺乏沟通时的分布式合作》,摘自:Proc。第14届国际米兰。交响乐团。《分布式计算》(DISC'00),2000年,第119-133页。;G.Malewicz,A.Russell,A.Shvartsman,《缺乏沟通时的分布式合作》,摘自:Proc。第14届国际米兰。交响乐团。分布式计算(DISC'00),2000年,第119-133页·Zbl 0987.68003号
[25] G.Malewicz,A.Russell,A.Shvartsman,《断开合作的最优调度》,摘自:Proc。第八国际。信息和通信复杂性的结构(SIROCCO’01),第259-274页,2001年6月。另请参阅:Proc。第19届ACM交响乐团。《分布式计算原理》(PODC’01),2001年。;G.Malewicz,A.Russell,A.Shvartsman,《断开合作的最优调度》,摘自:Proc。第八国际。信息和通信复杂性的结构(SIROCCO’01),第259-274页,2001年6月。另请参阅:Proc。第19届ACM交响乐团。《分布式计算原理》(PODC’01),2001年·Zbl 1266.68058号
[26] G.Malewicz,A.C.Russell,A.A.Shvartsman,分布式合作的本地调度,in:Proc。IEEE国际。交响乐团。《网络计算和应用》,NCA’2001年,2001年,第244-255页。;G.Malewicz,A.C.Russell,A.A.Shvartsman,分布式合作的本地调度,in:Proc。IEEE国际。交响乐团。《网络计算和应用》,NCA’2001年,2001年,第244-255页·Zbl 1266.68058号
[27] 莫瑟,L.E。;梅利亚·史密斯,P.M。;阿加拉瓦尔,D.A。;Budhia,R.K。;Lingley-Papadopolous,C.A.,《图腾:容错多播组通信系统》,美国通信协会,39,4,54-63(1996)
[28] A.Russell,A.Shvartsman,《分布式计算与设计理论的结合:非连接合作的本地调度》,《理论计算机科学的当前趋势:新世纪的挑战》,第1卷:算法与复杂性,世界科学,新加坡,2004年,第315-336页。;A.Russell,A.Shvartsman,《分布式计算与设计理论的结合:非连接合作的本地调度》,《理论计算机科学的当前趋势:新世纪的挑战》,第1卷:算法与复杂性,世界科学,新加坡,2004年,第315-336页·Zbl 1082.68006号
[29] van Renesse,R。;伯曼,K.P。;Maffeis,S.,《Horus:一种灵活的群组通信系统》,美国通信学会,39,476-83(1996)
[30] M.Saks,N.Shavit,H.Woll,最佳时间随机共识使弹性算法在实践中快速实现,发表于:Proc。第二届ACM-SIAM交响乐团。《离散算法》,1991年,第351-362页。;M.Saks,N.Shavit,H.Woll,《实践中快速达成共识的最佳时间随机弹性算法》,摘自:Proc。第二届ACM-SIAM交响乐团。《离散算法》,1991年,第351-362页·Zbl 0800.68463号
[31] D.Sleator,R.Tarjan,列表更新和分页规则的摊销效率,CACM 281985年,第202-208页。;D.Sleator,R.Tarjan,列表更新和分页规则的摊销效率,CACM 281985年,第202-208页。
[32] N.Shavit,并发时间戳,博士论文,希伯来大学数学和计算机科学学院,耶路撒冷,1990年。;N.Shavit,并发时间戳,博士论文,希伯来大学数学和计算机科学学院,耶路撒冷,1990年·Zbl 0874.68138号
[33] J.Sussman,K.Marzullo,《Bancomat问题:可分区异步系统中的资源分配示例》,摘自:Proc。第12届国际米兰。交响乐团。《分布式计算》,1998年。;J.Sussman,K.Marzullo,《Bancomat问题:可分区异步系统中的资源分配示例》,摘自:Proc。第12届国际米兰。交响乐团。分布式计算,1998年·Zbl 1026.68008号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。