×

多核CPU的缓存效率高的并行eikonal解算器。 (英语) Zbl 1405.86015号

概述:在地震应用中,通常使用程函方程的数值解来计算给定速度模型的初至旅行时。大型三维模型的计算变得昂贵,需要使用高效的并行求解器。我们提出了针对共享内存系统(如多核CPU)优化的快速扫描和锁定扫描方法的新并行实现;我们称之为块快速扫描方法(BFSM)和块锁定扫描方法(BLSM)。提出的方法基于域分解方法,特别注意高速缓存利用率和任务执行同步的高效性。在实际模型上的性能测试表明,在现代多核CPU上,并行效率高达85–95%,并且需要与串行扫描方法相同的迭代次数才能收敛。我们还强调了在以平衡为目标的迭代扫描方法中正确选择停止标准的重要性计算时间和应用程序所需结果的准确性之间的关系。特别是,我们表明,在地震应用中,与使用完全收敛停止准则的情况相比,可以达到计算旅行时间的合理精度,同时大大减少迭代次数。

MSC公司:

86甲15 地震学(包括海啸建模)、地震
第65年 并行数值计算
86年第35季度 与地球物理相关的PDE
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bak,S.,McLaughlin,J.,Renzi,D.:快速扫描方法的一些改进。SIAM J.科学。计算。32(5), 2853-2874 (2010) ·Zbl 1219.65124号 ·doi:10.1137/090749645
[2] Bleistein,N.、Cohen,J.K.、John,W.Jr.等人:《多维地震成像、偏移和反演数学》,第13卷。施普林格科技与商业媒体,柏林(2013)
[3] Breuß,M.,Cristiani,E.,Gwosdek,P.,Vogel,O.:用于快速行进法并行化的自适应域分解技术。申请。数学。计算。218(1), 32-44 (2011) ·Zbl 1269.65132号
[4] Capozzoli,A.,Curcio,C.,Liseno,A.,Savarese,S.:Eikonal方程解的快速推进、快速扫描和快速迭代方法的比较。摘自:第21届电信论坛,第685-688页(2013年)
[5] Cerveny,V.:地震射线理论。剑桥大学出版社,剑桥(2005)·Zbl 0990.86001号
[6] Chacon,A.,Vladimirsky,A.:航程方程的快速双尺度方法。SIAM J.科学。计算。34(2),A547-A578(2012)·Zbl 1244.49047号 ·数字对象标识码:10.1137/10080909X
[7] Chacon,A.,Vladimirsky,A.:Eikonal方程的并行双尺度方法。SIAM J.科学。计算。37(1),A156-A180(2015)·Zbl 1348.49025号 ·数字对象标识码:10.1137/12088197X
[8] Crandall,M.G.,Lions,P.L.:哈密尔顿-雅可比方程的粘度解。变速器。美国数学。Soc.277(1),1-42(1983)·Zbl 0599.35024号 ·doi:10.1090/S0002-9947-1983-0690039-8
[9] Detrixhe,M.,Gibou,F.:静态Hamilton-Jacobi方程的混合大规模并行快速扫描方法。J.计算。物理学。322, 199-223 (2016) ·Zbl 1352.65624号 ·doi:10.1016/j.jcp.2016.06.023
[10] Detrixhe,M.,Gibou,F.,Min,C.:Eikonal方程的并行快速扫描方法。J.计算。物理学。237, 46-55 (2013) ·doi:10.1016/j.jp.2012.11.042
[11] Dijkstra,E.W.:关于与图有关的两个问题的注释。数字。数学。1(1), 269-271 (1959) ·Zbl 0092.16002号 ·doi:10.1007/BF01386390
[12] Duchkov,A.,de Hoop,M.:地震成像向下延拓方法中的速度延拓。地球物理学。《国际期刊》176909-924(2009)·文件编号:10.1111/j.1365-246X.2008.04023.x
[13] Duchkov,A.A.,De Hoop,M.V.:叠前深度(地图)偏移中的扩展等时线。《地球物理学》75(4),S139-S150(2010)·doi:10.190/1.3459955
[14] Fomel,S.:微分偏移延拓理论。地球物理学68(2),718-732(2003)·doi:10.190/11.567242
[15] Hubral,P.,Tygel,M.,Schleicher,J.:地震成像波。地球物理学。《国际期刊》第125卷第2期,第431-442页(1996年)·doi:10.1111/j.1365-246X.1996.tb00009.x
[16] 英特尔合作:英特尔64与IA-32体系结构优化参考手册。http://www.intel.com/content/www/us/en/architecture-and-technology/64-ia-32-architectures-optimization-manual.html。2017-01-16(2016)访问
[17] Jeong,W.K.,Whitaker,R.T.:程函方程的快速迭代方法。SIAM J.科学。计算。30 (5), 2512-2534 (2008) ·Zbl 1246.70003号 ·doi:10.1137/060670298
[18] Kao,C.Y.,Osher,S.,Qian,J.:静态hamilton-jacobi方程的Lax-friedrichs扫描格式。J.计算。物理学。196(1), 367-391 (2004) ·Zbl 1053.65088号 ·doi:10.1016/j.jcp.2003.11.007
[19] Nikitin,A.:块扫描方法(源代码)。https://doi.org/10.5281/zenodo.269001 (2017)
[20] Rouy,E.,Tourin,A.:从形状到阴影的粘度溶液方法。SIAM J.数字。分析。29(3), 867-884 (1992) ·Zbl 0754.65069号 ·doi:10.1137/0729053
[21] Serdyukov,A.、Duchkov,A.:地震波方程建模、成像和层析成像的混合动力学方法。数学。问题。工程2015,543540(2015)·Zbl 1394.86006号 ·doi:10.1155/2015/543540
[22] Sethian,J.A.:用于单调前进前沿的快速行进水平集方法。程序。国家。阿卡德。科学。93(4),1591-1595(1996)·Zbl 0852.65055号 ·doi:10.1073/pnas.93.4.1591
[23] Sethian,J.A.:《水平集方法和快速推进方法:计算几何、流体力学、计算机视觉和材料科学中的进化接口》,第3卷。剑桥大学出版社,剑桥(1999)·Zbl 0973.76003号
[24] Sethian,J.A.,Vladimirsky,A.:静态Hamilton-Jacobi方程的有序迎风方法:理论和算法。SIAM J.数字。分析。41(1), 325-363 (2003) ·兹比尔1040.65088 ·doi:10.1137/S0036142901392742
[25] Stolk,C.C.,de Hoop,M.V.,Symes,W.W.:猎头手机迁移的运动学。地球物理学74(6),WCA19-WCA34(2009)·doi:10.1190/1.3256285
[26] Tanenbaum,A.S.:结构化计算机组织Pearson(2006)
[27] Tsai,R.,Osher,S.等人:综述文章:水平集方法及其在图像科学中的应用。Commun公司。数学。科学。1(4), 1-20 (2003) ·doi:10.4310/CMS.2003.v1.n4.a1
[28] Tsitsiklis,J.N.:全局最优轨迹的高效算法。IEEE传输。自动。控制40(9),1528-1538(1995)·Zbl 0831.93028号 ·doi:10.1109/9.412624
[29] Vidale,J.:行程时间的有限差分计算。牛市。地震波。《美国社会杂志》第78卷(6期),2062-2076页(1988年)
[30] Vidale,J.E.:三维旅行时间的有限差分计算。地球物理学55(5),521-526(1990)·数字对象标识代码:10.1190/1.1442863
[31] Zhao,H.:Eikonal方程的快速扫描方法。计算数学74(250),603-627(2005)·Zbl 1070.65113号 ·doi:10.1090/S0025-5718-04-01678-3
[32] Zhao,H.:快速扫描方法的并行实现。J.计算。数学。25, 421-429 (2007)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。