×

流线模拟器的并行实现。 (英语) Zbl 1171.86304号

摘要:我们讨论了流线模拟器并行化的各种策略,并提出了一种单相共享内存实现。共享内存编程模型的选择是因为它适合于流线型模拟,以及多核处理器的快速发展,这些处理器很容易以低成本获得。我们表明,通过将多维传输方程分解为一组独立的一维传输解,基于流线的方法很容易在共享内存体系结构上并行化。我们测试了一种专门的显式负载平衡算法和OpenMP在共享内存机器上提供的动态负载平衡算法,该算法优化了线程之间的流线型负载分布,以最大限度地减少任何线程空闲的时间。我们的结果清楚地表明,只要每个线程的流线数量足够高,内置调度器就可以与专门的负载平衡策略竞争,这在现场应用中就是如此。每个线程的平均工作负载名义上对各个流线之间的工作负载变化不敏感,显式策略提供的任何负载平衡优势都不足以克服相关的计算和并行开销。就流线或流线段到线程的分配而言,我们研究了分配给线程流线段的分布式方法,以及线程拥有完整流线的所有者方法。我们发现所有者方法最合适。分布式方法在负载平衡方面的微小优势不足以补偿额外的开销。此外,所有者方法允许直接重用现有序列代码,而在隐式或自适应隐式解决方案策略的情况下,分布式方法并非如此。流线模拟中的跟踪和映射阶段并行效率低。然而,在实际模型中,流线解的计算负担明显大于跟踪和映射阶段的计算负担,因此,这些阶段的影响是有限的。我们在三个共享内存系统上测试了并行化:一个24双核处理器的Sun SPARC服务器;一个八路Sun Opteron服务器,代表了业界使用的最先进的共享内存系统;以及最近发布的Sun Niagara II多核机器,该芯片上有八个浮点计算单元。我们在三个不同井位的非均质储层上测试了单相流动问题(该系统给出了最坏的情况,因为与运输成本相比,追踪和绘图成本是不可忽略的)。对于SPARC和Opteron系统,我们发现示踪流问题的并行效率介于60到75之间。次线性加速主要是由于跟踪和映射阶段的通信开销造成的。在具有更复杂物理的应用中,这些阶段的相对贡献将显著降低,我们预测并行性能将接近线性。在尼亚加拉II上,由于这些具有共享缓存的体系结构上的通信成本降低,即使对于单相流问题,我们也可以获得几乎完美的线性可伸缩性。考虑到未来的服务器设计将类似于此系统,此结果更加令人满意。

MSC公司:

2008年6月 地球物理学相关问题的计算方法
76米25 其他数值方法(流体力学)(MSC2010)
68瓦10 计算机科学中的并行算法

软件:

PVM公司
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Abate,J.,Wang,P.,Sepehrnoori,K.:PC集群上的并行组分油藏模拟。国际J。高性能计算。申请。15(1), 13–21 (2001) ·doi:10.1177/10943420101500102
[2] Batycky,R.P.:三维二相现场尺度流线模拟器。斯坦福大学博士论文(1997)
[3] Berger,M.、Aftosmis,M.,Marshall,D.、Murman,S.:使用混合编程范式的新型CFD流求解器的性能。J.平行分布计算。65(4), 414–423 (2005) ·Zbl 1079.68520号 ·doi:10.1016/j.jpdc.2004.11.010
[4] Cao,H.,Tchelepi,H.、Wallis,J.R.、Yardumian,H.:油藏模拟的并行可扩展非结构化CPR型线性解算器。地点:SPE年度技术会议和展览会,达拉斯,2005年10月9-12日
[5] Charlesworth,A.:太阳壁炉系统互连。收录:2001年ACM/IEEE超级计算会议记录(CDROM),第7–7页,丹佛,2001年11月10–16日
[6] Chow,E.、Falgout,R.、Hu,J.、Tuminaro,R.和Yang,U.:多重网格求解器的并行化技术综述。内容:科学计算并行处理,软件、环境和工具SIAM系列。SIAM,费城(2006)
[7] Christie,M.,Blunt,M.:第十个SPE比较解决方案项目:升级技术的比较。SPE储备。埃瓦卢。工程4(4),308–317(2001)
[8] Crane,M.、Bratvedt,F.、Bratvedt、K.、Childs,P.、Olufsen,R.:一个全合成流线模拟器。参加:SPE年度技术会议和展览,达拉斯,2000年10月1日至4日
[9] Culler,D.,Singh,J.,Gupta,A.:并行计算机体系结构:硬件/软件方法。Morgan Kaufman,旧金山(1998)
[10] Dagum,L.,Menon,R.:OpenMP:用于共享内存编程的行业标准API。计算。科学。工程IEEE 5(1),46–55(1998)·数字对象标识代码:10.1109/99.660313
[11] DiDonato,G.,Blunt,M.J.:裂缝性储层中反应性运移和流动的基于流线的双重孔隙度模拟。水资源。第40(4)号决议,(2004年)
[12] Gropp,W.D.,Kaushik,D.K.,Keyes,D.E.,Smith,B.F.:高性能并行隐式CFD。并行计算。27(4), 337–362 (2001) ·Zbl 0971.68191号 ·doi:10.1016/S0167-8191(00)00075-2
[13] IEEE便携式应用程序标准委员会:便携式操作系统接口(POSIX)-第1部分:系统应用程序编程接口(API)[C语言]。IEEE标准1003.1-1996,ISO/IEC 9945-1(1996)
[14] Keats,W.A.,Lien,F.:可压缩欧拉方程的二维各向异性笛卡尔网格自适应。国际期刊数字。方法流体46(11),1099–1125(2004)·Zbl 1060.76589号 ·doi:10.1002/fld.780
[15] Kongetira,P.,Aingaran,K.,Olukotun,K.:尼亚加拉:32路多线程SPARC处理器。IEEE MICRO 25(2),21–29(2005)·doi:10.1109/MM.2005.35
[16] Laudon,J.,Spracklen,L.:即将到来的多线程芯片多处理器浪潮。国际J并行程序。35(3), 299–330 (2007) ·doi:10.1007/s10766-007-0033-6
[17] Ma,Y.,Chen,Z.:多组分多相流体油藏热模拟的并行计算。J.计算。物理学。201(1), 224–237 (2004) ·兹比尔1195.76392 ·doi:10.1016/j.jcp.2004.05.014
[18] Mallison,B.T.,Gerritsen,M.G.,Matringe,S.F.:基于流线的模拟的改进映射。SPE J.(SPE 89352)(2005年)
[19] Mattson,T.G.:OpenMP有多好?。科学。程序。11, 81–93 (2003)
[20] 消息传递接口论坛。MPI2:消息传递接口标准。高性能计算。申请。12(1–2), 1–299 (1998)
[21] Oliker,L.,Li,X.,Husbands,P.,Biswas,R.:排序策略和编程范式对稀疏矩阵计算的影响。SIAM版本44(3),373–393(2002)·兹比尔1006.65028 ·doi:10.1137/S00361445003820
[22] Olukotun,K.,Hammond,L.:微处理器的未来。ACM队列3(7),26-29(2005)·doi:10.1145/1095408.1095418
[23] OpenMP体系结构审查委员会。OpenMP Fortran规范v2.5。OpenMP体系结构审查委员会(2005)
[24] Pinar,A.,Aykanat,C.:1D分区的快速优化负载平衡算法。J.平行分布计算。64(8), 974–996 (2004) ·Zbl 1068.68038号 ·doi:10.1016/j.jpdc.2004.05.003
[25] Pollock,D.W.:有限差分模型路径线的半解析计算。地下水26(6),743–750(1988)·doi:10.1111/j.1745-6584.1988.tb00425.x
[26] Sunderam,V.S.:PVM:并行分布式计算框架。并发:实践与经验2(4),315–339(1990)·doi:10.1002/cpe.4330020404
[27] Sutter,H.,Larus,J.:软件和并发革命。ACM队列3(7),54–62(2005)·doi:10.1145/1095408.1095421
[28] Thiele,M.,Batycky,R.P.:使用流线衍生注入效率改进注水管理。SPE储备。埃瓦卢。工程9,187-196(2006)
[29] Thiele,M.R.,Batycky,R.P.,Blunt,M.J.:一种基于流线的三维油田规模成分储层模拟器。SPE储备。工程12(4),246–254(1997)
[30] Wang,P.,Balay,S.,Sepehrnoori,K.,Wheeler,J.,Abate,J.、Smith,B.B.、Pope,G.A.:用于大规模油藏模拟的完全隐式并行EOS组成模拟器。收件人:SPE 5188(1999)
[31] Wu,Y.-S.,Zhang,K.,Ding,C.,Pruess,K.、Elmroth,E.、Bodvarsson,G.S.:一种高效的并行计算方法,用于模拟多孔和裂缝介质中的非等温多相流和多组分输运。高级水资源。25(3), 243–261 (2002) ·doi:10.1016/S0309-1708(02)00006-4
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。