×

混合并行平台的一系列调度算法。 (英语) 兹比尔1387.68043

摘要:越来越多的并行计算平台构建在混合体系结构上,这种混合体系结构结合了多核处理器(CPU)和硬件加速器,如通用图形处理单元(GPGPU)。在本文中,我们提出了一种新的方法来高效调度具有(m)个CPU和(k)个GPGPU的并行应用程序,其中应用程序的每个任务可以在普通内核(CPU)或GPGPU上处理。我们考虑调度独立任务的问题,目标是最小化完成整个应用程序的时间(makespan)。这个问题是NP-hard问题,因此,我们提出了两类逼近算法,当只考虑一个GPGPU时,可以实现任意整数(q\geq1)的(frac{2q+1}{2q}+epsilon)或(frac}2(q+1)}{2Q+1}+epsilon)的逼近比,以及(frac[2q+1}}{2q}+frac{1}{2k}+epsi lon)和(k\geq2)GPGPU的{2q+1}+\frac{1}{(2q+1)k}+\epsilon。该方法基于使用动态规划算法的对偶近似方案。相关的计算成本是每一步对偶近似的第一(第二)族的(mathcal{O}(n^2k^{q+1}m^q)(分别为,(mathcal{O}(n^2 k^{q+2}m^{q+1}))。参数\(q\)的值越大,近似越好,但计算成本越高。最后,我们提出了该算法的一个放松版本,该算法的运行时间为(mathcal{O}(n\logn)),近似界为(2)。最后的结果与最先进的算法HEFT进行了比较。所提出的求解方法是第一个用于混合机器调度的通用算法,具有理论性能保证,可用于实际目的。

MSC公司:

68平方米 计算机系统环境下的性能评估、排队和调度
68周25 近似算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Agullo,E.、Augonnet,C.、Dongarra,J.、Faverge,M.、Ltaief,H.、Thibault,S.和Tomov,S.,《使用多个GPU加速器增强的多核节点上的QR因式分解》,IEEE国际并行与分布式处理研讨会(IPDPS)(2011年)。
[2] Augonnet,C.、Thibault,S.、Namyst,R.和Wacrenier,P.A.,StarPU:异构多核架构任务调度的统一平台,《并发与计算:实践与经验》23(2)(2011)187-198。
[3] Blazewicz,J.、Ecker,K.、Pesch,E.、Schmidt,G.和Weglaz,J.,《调度手册:从理论到应用》,《信息系统国际手册》。斯普林格(2007)·Zbl 1165.90009
[4] Bleuse,R.、Kedad-Sidhoum,S.、Monna,F.、Mouni,G.和Trystram,D.,使用GPU加速器在多核上调度独立任务,并发与计算:实践与经验27(6)(2015)1625-1638。
[5] V.Bonifaci和A.Wiese,《调度少数不同类型的无关机器》,CoRR abs/1205.0974(2012)。
[6] Boukerche,A.、Correa,J.M.、Melo,A.和Jacobi,R.P.,《线性空间中双基因生物序列比对快速检索的硬件加速器》,IEEE Trans。计算59(2010)808-821·Zbl 1366.92004号
[7] Bueno,J.、Planas,J.,Duran,A.、Badia,R.M.、Martorell,X.、Ayguadé,E.和Labarta,J.《使用ompss对gpu集群进行生产性编程》,载于IPDPS,第557-568页,IEEE计算机学会(2012)。
[8] Chen,L.,Ye,D.S.和Zhang,G.C.,《CPU-GPU混合作业的在线调度》,国际期刊发现。计算。科学25(6)(2014)745-762·Zbl 1304.68023号
[9] Friesen,D.K.,统一处理器上lpt调度的更严格界限,SIAM J.Comput.16(3)(1987)554-560·Zbl 0654.68033号
[10] Garey,M.R.和Grahams,R.L.,资源约束下多处理器调度的边界,SIAM J.Compute.4(1975)187-200·兹伯利0333.68041
[11] Gautier,T.、Ferreira,L.、Joao,V.、Maillard,N.和Raffin,B.、Xkaapi:异构架构上数据流任务编程的运行时系统,见Proc。IEEE国际并行与分布式处理研讨会(IPDPS)(2013)。
[12] J.C.Gehrke、K.Jansen、S.E.J.Kraft和J.Schikowski,《调度少数不同类型的无关机器的PTAS技术报告》,Bericht Nr.1506 ISSN 2192-6247(2015)·Zbl 1442.90073号
[13] Graham,R.L.,《多处理时间异常的界限》,SIAM J.Appl。数学17(2)(1969)416-429·Zbl 0188.23101号
[14] Hochbaum,D.S.和Shmoys,D.B.,《使用双重近似算法解决调度问题的理论和实际结果》,J.ACM34(1)(1987)144-162。
[15] Hochbaum,D.S.和Shmoys,D.B.,统一处理器上调度的多项式近似方案:使用对偶近似方法,SIAM J.Comput.17(3)(1988)539-551·Zbl 0647.68040号
[16] Imreh,C.,两组相同机器上的调度问题,Computing70(2003)277-294·Zbl 1033.90041号
[17] Lee,V.W.,Kim,C.,Chhugani,J.,Deisher,M.,Kim。ACM SIGARCH Computer Architecture News ISCA’10,第38卷(2010),第451-460页。
[18] Lenstra,J.K.,Shmoys,D.B.和Tardos,E.,调度无关并行机的近似算法,数学。方案46(1990)259-271·Zbl 0715.90063号
[19] Raravi,G.和Nélis,V.,在两类异构多处理器上分配零星任务的PTAS,实时系统研讨会(RTSS)(2012)117-126。
[20] Phillips,J.C.、Stone,J.E.和Schulten,K.,《将消息驱动的并行应用程序应用于gpu加速集群》,《高性能计算、网络、存储和分析》(2008),第1-9页。
[21] Pinel,F.、Dorronsoro,B.和Bouvry,P.,《解决gpu上独立任务调度问题的超大实例》,J.Parallel Distribute.Compute.73(1)(2013)101-110。
[22] Shchepin,E.V.和Vakhania,N.,最佳舍入为调度无关机器提供了更好的近似值,Oper。Res.Lett.33(2004)127-133·Zbl 1099.90024号
[23] Shmoys,D.B.和Tardos,E.,广义指派问题的近似算法,数学。方案62(1993)461-474·Zbl 0804.90077
[24] Song,F.、Tomov,S.和Dongarra,J.,《异构多核和多gpu系统上的启用和缩放矩阵计算》,第26届ACM超级计算国际会议(ICS)(2012年)。
[25] Topcouglu,H.、Hariri,S.和Wu,M.Y.,异构计算的高效性能和低复杂性任务调度,IEEE Trans。平行分销系统13(3)(2002)260-274。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。