塞林·马拉基;穆罕默德·杰姆尼 多核处理器上求解三角带线性系统的负载平衡静态调度。 (英语) Zbl 1497.65064号 芬丹。通知。 179,编号1,35-58(2021). 总结:本研究建立了一种求解三角带线性系统的新方法,以平衡负载并获得高度的并行性。我们的研究包括为每个任务分配足够的启动时间和处理器,并消除并行求解阶段未使用的无用依赖。因此,处理器在考虑优先约束的情况下并行执行其相关任务。确定了并行执行时间的理论下限和在最短时间内执行任务图所需的处理器数量。实验是在共享内存多核处理器上实现的。实验结果与从确定的数学公式中得出的值进行了拟合。通过将我们的贡献与属于多核结构并行线性代数软件库PLASMA的三角系统解析例程的结果进行比较,证实了所提方法的有效性。 MSC公司: 65平方英尺 线性系统和矩阵反演的直接数值方法 2005年5月 并行数值计算 68平方米 计算机系统环境下的性能评估、排队和调度 关键词:求解三角带线性系统;并行执行时间;负载平衡;优先关系图;共享内存多核处理器 软件:血浆;蟒蛇 PDF格式BibTeX公司 XML格式引用 \textit{S.Marrakhi}和\textit{M.Jemni},Fundam。通知。179,编号1,35-58(2021;兹bl 1497.65064) 全文: 内政部 参考文献: [1] Luszczek P、Kurzak J、Dongarra J。稠密线性代数软件回顾。并行与分布式计算杂志,2014.74(7):2548-2560。doi:10.1016/j.jpdc.2013.10.005。 [2] Chen C,Pouransari H,Rajamannickam S,Boman EG,Darve E.一般稀疏线性系统的分布式内存层次求解器。并行计算,2018.74:49-64。doi:10.1016/j.parco.2017.12.004。 [3] Joux A,Pierrot C.近稀疏线性代数及其在离散对数计算中的应用。摘自:《有限领域和应用的当代发展》,第119-144页。《世界科学》,2016年。doi:10.11142/9789814719261 0008·Zbl 1365.65130号 [4] Maggioni M,Berger-Wolf T。GPU上稀疏矩阵向量乘法的优化技术。并行与分布式计算杂志,2016.93-94:66-86。doi:10.1016/j.jpdc.2016.03.011。 [5] Mayer J.求解具有稀疏三角形矩阵的线性系统的并行算法。计算机,2009年。86:291-312. doi:10.1007/s00607-009-0066-3·Zbl 1179.65038号 [6] Naumov M.在GPU上用预处理迭代法并行求解稀疏三角线性系统。NVIDIA技术报告NVR-2011-0012011。统一资源定位地址https://research.nvidia.com/sites/default/files/publications/nvr-2011-001.pdf。 [7] Park J、Smelyanskiy M、Sundaram N、Dubey P.高性能共享内存稀疏三角解算器的稀疏化同步。摘自:国际超级计算会议(ISC),计算机科学讲稿第8488卷。施普林格,2014年,第124-140页。doi:10.1007/978-3-319-07518-1 8。 [8] Totoni E,Heath MT,Kale LV.稀疏三角线性系统的结构自适应并行解。并行计算,2014.40(9):454-470。doi:10.1016/j.parco.2014.06.006。 [9] Liu W,Li A,Hogg J,Duff IS,Vinter B.并行稀疏三角形解的无同步算法。摘自:《2016年欧洲-巴黎:并行处理:并行和分布式计算国际会议》,计算机科学讲稿第9833卷。Springer,2016年,第617-630页。doi:10。1007/978-3-319-43659-3 45. ·Zbl 1439.65035号 [10] Liu W,Li A,Hogg JD,Duff IS,Vinter B.具有多个右手边的并行稀疏三角形解的快速无同步算法。并发与计算:实践与经验,2017。29(21). doi:10.1002/cpe.4244。 [11] Marrakhi S,Jemni M.使用OpenMP接口在多核平台上求解稀疏三角系统的精细粒度并行解决方案。2017年高性能计算与仿真国际会议(HPCS)。IEEE,2017年,第659-666页。doi:10.1109/HPCS.2017.102。 [12] Marrakhi S,Jemni M.多核机器上求解三角带系统的并行调度算法。摘自:《并行计算无处不在》,《国际并行计算会议论文集》,ParCo 2017,《并行计算进展》第32卷。IOS出版社,2018年,第127-136页。doi:10.3233/978-1-61499-843-3-127。 [13] Dongarra J,Gates M,Haidar A,Kurzak J,Luszczek P,Wu P,Yamazaki I,Yarkhan A,Abalenkovs M,Bagherpour N,Hammarling S,S´ıstek J,Stevens D,Zounon M,Relton SD。等离子体:使用OpenMP的多核并行线性代数软件。ACM数学软件汇刊,2019年。45(2):1-35. doi:10.1145/3264491·Zbl 1471.65029号 [14] 张晓东。矩阵分析与应用。剑桥大学出版社,2017年。国际标准图书编号978-1-10827758-7。doi:10.1017/9781108277587·Zbl 1381.65027号 [15] 麦克拉伦RG。第八章LU分解与带状矩阵。摘自:《使用Python的计算核工程和放射科学》,第131-144页。学术出版社,2018年。doi:10.1016/B978-0-12-812253-2.00010-8。 [16] Meier U,Skinner G,Gunnels J.稀疏矩阵计算代码集。技术报告,加拿大可持续发展委员会报告,1991年。统一资源定位地址http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.32。4208&rep=rep1&type=pdf。 [17] Gerbner D,Keszegh B,Palmer C,P´alv¨olgyi D。加权有向无环图的拓扑序。信息处理快报,2016.116(9):564-568。doi:10.1016/j.ipl.2016.04.007·Zbl 1358.05132号 [18] Mazurkiewicz A.三角图的局部计算。基础信息学,2010.100(14):117-140。doi:10.3233/FI-2010-266·Zbl 1215.68187号 [19] Kayaslan E,Lambert T,Marchal L,Ucâar B。调度串行并行任务图以最小化峰值内存。理论计算机科学,2018.707:1-23。doi:10.1016/j.tcs.2017.09.037·Zbl 1383.68013号 [20] Arabnejad H,Barbosa JG。基于乐观代价表的异构系统列表调度算法。IEEE并行和分布式系统汇刊,2014.25(3):682-694。doi:10.1109/TPDS。2013.57. [21] Bhasin H,Gupta N.使用遗传算法的调度关键路径问题。摘自:《软计算:理论和应用》,SoCTA 2016年会议记录,第1卷,智能系统和计算进展583卷。施普林格,2018年,第15-24页。doi:10.1007/978-981-10-5687-12。 [22] 5000网格。统一资源定位地址https://www.grid5000.fr。 [23] 等离子体项目。统一资源定位地址http://icl.cs.utk.edu/plassm/。 [24] Agullo E、Dongarra J、Nath R、Tomov S.A多核架构的全经验自动调谐密集QR分解。摘自:《2011年欧洲-保时捷并行处理》,计算机科学讲义第6853卷。施普林格,2011年,第194-205页。doi:10.1007/978-3642-23397-5 19。 [25] Wu X.并行系统的性能评估、预测和可视化,计算机和信息科学亚洲研究国际丛书第4卷。斯普林格,1999年。国际标准图书编号978-14615-5147-8。doi:10.1007/978-1-4615-5147-8·Zbl 0927.68035号 [26] 穆尼尔A、戈登·罗斯A、兰卡·S。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。