×

高吞吐量工作负载执行的协同调度算法。 (英语) Zbl 1386.90045号

摘要:本文研究用于处理一组并行应用程序的联合调度算法。我们的目标是并发调度多个应用程序,而不是逐个执行每个应用程序,对每个应用程序使用最大程度的并行性。我们将原始应用程序集划分为一系列包,这些包逐个执行。一个包包含多个应用程序,每个应用程序都分配了一定数量的处理器,但有一个限制,即在一个包内分配的处理器总数不超过可用处理器的最大数量。目标是确定包的分区,并将处理器分配给应用程序,以最大限度地减少包的执行时间总和。我们深入研究了该优化问题的复杂性,并提出了几种在各种工作负载上表现出非常好性能的启发式算法,其应用程序执行时间模拟了并行科学代码的情况。我们表明,联合调度可以加快工作负载完成时间(与传统调度相比平均提高40%)和更快的响应时间(提高50%)。因此,联合调度提高了系统吞吐量并节省了能源,从而从用户和系统的角度带来了巨大的好处。

理学硕士:

90B35型 运筹学中的确定性调度理论
68平方米 计算机系统环境下的性能评估、排队和调度
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Balay,S.、Brown,J.、Buschelman,K.、Gropp,W.D.、Kaushik,D.、Knepley,M.G.、McInnes,L.C.、Smith,B.F.和Zhang,H.(2012)。PETSc网页。http://www.mcs.anl.gov/petsc。
[2] Balay,S.、Abhyankar,S.,Adams,M.F.、Brown,J.、Brune,P.、Buschelman,K.、Eijkhout,V.、Gropp,W.D.、Kaushik,D.、Knepley,M.G.、McInnes,L.C.、Rupp,K.,Smith,B.F.和Zhang,H.(2014)。PETSc网页。http://www.mcs.anl.gov/petsc, http://www.mcs.anl.gov/petsc。 ·Zbl 1327.68054号
[3] Bhadauria,M.和McKee,S.A.(2010年)。CMP的资源-软件联合调度方法。摘自:第24届ACM超级计算ICS’10国际会议论文集,ACM。
[4] Blackford,L.S.、Choi,J.、Cleary,A.、D'Azeuedo,E.、Demmel,J.,Dhillon,I.、Hammarling,S.、Henry,G.、Petitet,A.、Stanley,K.、Walker,D.和Whaley R.C.(1997)。ScaLAPACK用户指南。暹罗。美国宾夕法尼亚州费城·Zbl 0886.65022号
[5] Borgesson,L.(1996)。阿巴库斯。收录于:断裂介质的热-水-机械耦合过程——数学和实验研究,第79卷。阿姆斯特丹,爱思维尔(Elsevier)(第565-570页)·Zbl 0830.65120号
[6] Brucker,P.、Gladky,A.、Hoogeveen,H.、Kovalyov,M.Y.、Potts,C.、Tautenhahn,T.等人(1998年)。调度配料机。《调度杂志》,1,31-54·Zbl 0909.90172号 ·doi:10.1002/(SICI)1099-1425(199806)1:1<31::AID-JOS4>3.0.CO;2-右
[7] Chandra,D.、Guo,F.、Kim,S.和Solihin,Y.(2005)。预测芯片多处理器体系结构上的线程间缓存争用。参见:HPCA 11,IEEE(第340-351页)。doi:10.1109/HPCA.2005.27。
[8] Coffman,E.G,Jr,Garey,M.R.,Johnson,D.S.和Tarjan,R.E.(1980年)。面向水平的二维布局算法的性能边界。SIAM计算机杂志,9(4),808-826·Zbl 0447.68079号 ·doi:10.1137/0209062
[9] 科门,T。H.、Leiserson、C。E.、Rivest、R。L.,&Stein,C.(2009年)。算法简介。剑桥:麻省理工学院出版社·Zbl 1187.68679号
[10] Deb,R.K.和Serfozo,R.F.(1973年)。批处理服务队列的最佳控制。应用概率进展,340-361·Zbl 0264.60066号
[11] Drozdowski,M。;Leung,JYT(编辑),《调度并行任务:算法和复杂性》,第26章(2003年),博卡拉顿
[12] Dutot,PF;Leung,JYT(编辑),《调度并行任务:近似算法》,第26章(2003年),博卡拉托
[13] Frachtenberg,E.、Feitelson,D.、Petrini,F.和Fernandez,J.(2005)。具有柔性协同调度的自适应并行作业调度。IEEE并行和分布式系统汇刊,16(11),1066-1077。doi:10.1109/TPDS.2005.130·doi:10.1109/TPDS.2005.130
[14] Garey,M.R.和Johnson,D.S.(1979年)。计算机和棘手。NP-完备性理论指南。纽约:W.H,Freeman and Co·Zbl 0411.68039号
[15] 戈登。(2011). Gordon用户指南:技术总结。http://www.sdsc.edu/us/resources/gordon/
[16] Hankendi,C.和Coskun,A.(2012年)。通过有效的并行工作负载联合调度降低计算的能源成本。摘自:2012年欧洲会议展览设计、自动化测试(DATE)(第994-999页)。doi:10.1109/DATE.2012.6176641。
[17] Heroux,M.A.、Doerfler,D.W.、Crozier,P.S.、Willenbring,J.M.、Edwards,H.C.、Williams,A.、Rajan,M.、Keiter,E.R.、Thornquist,H.K.和Numrich,R.W.(2009)。通过微型应用程序提高性能。美国桑迪亚国家实验室5574号研究报告·Zbl 1327.68054号
[18] Ikura,Y.和Gimple,M.(1986年)。用于单个批处理机器的高效调度算法。《运营研究快报》,5(2),61-65·Zbl 0594.90045号 ·doi:10.1016/0167-6377(86)90104-5
[19] Kamil,S.、Shalf,J.和Strohmaier,E.(2008)。高性能计算中的能效。包含:IPDPS、IEEE·Zbl 0909.90172号
[20] Koehler,F.和Khuller,S.(2013年)。并行机器的最佳批处理计划。摘自:第13届年度算法和数据结构研讨会论文集·Zbl 1390.68131号
[21] Koole,G.和Righter,R.(2001年)。一个随机批处理和调度问题。《工程和信息科学中的概率》,15(04),465-479·Zbl 1003.90021号
[22] Kresse,G.和Hafner,J.(1993)。液态金属从头算分子动力学。物理评论B,47(1),558-561·doi:10.1103/PhysRevB.47.558
[23] Li,D.,Nikolopoulos,D.S.,Cameron,K.,de Supinski,B.R.,&Schulz,M.(2010)。高端计算系统的Power-aware MPI任务聚合预测。IPDPS,10,1-12。
[24] Lodi,A.、Martello,S.和Monaci,M.(2002年)。二维包装问题:综述。欧洲运筹学杂志,141(2),241-252·Zbl 1081.90576号 ·doi:10.1016/S0377-2217(02)00123-6
[25] Muthuvelu,N.、Chai,I.、Chikkannan,E.和Buyya,R.(2011年)。细粒度网格任务的批量调整策略和技术:具体细节。信息处理系统杂志,7(2),299-320·doi:10.3745/JIPS.2011.7.2.299
[26] Plimpton,S.(1995)。短程分子动力学的快速并行算法。计算物理杂志,117,1-19·Zbl 0830.65120号 ·doi:10.1006/jcph.1995.1039
[27] Potts,C.N.和Kovalyov,M.Y.(2000年)。分批调度:综述。《欧洲运筹学杂志》,120(2),228-249·Zbl 0953.90028号
[28] Rountree,B.、Lownenthal,D.K.、de Supinski,B.R.、Schulz,M.、Freeh,V.W.和Bletsch,T.(2009)。慢板:使DVS适用于复杂的HPC应用。ICS,09,460-469。
[29] Scogland,T.、Subramaniam,B.和Feng,W.C.(2011),《绿色发展的新兴趋势500:第三年》。参加:美国阿拉斯加安克雷奇第七届高性能、Power-Aware计算研讨会。
[30] Shantharam,M.、Youn,Y.和Raghavan,P.(2013年)。Speedup-ware联合调度,实现高效的工作负载管理。平行处理信函,23(2),1340001·Zbl 1327.68054号 ·doi:10.1142/S012962641340001X
[31] Turek,J.、Schwiegelshohn,U.、Wolf,J.L.和Yu,P.S.(1994年)。安排并行任务以最小化平均响应时间。摘自:第五届ACM-SIAM离散算法年会论文集,工业和应用数学学会(第112-121页)·Zbl 1114.68337号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。