×

面向大规模多插槽、多核并行仿真:仅支持MPI的半导体设备模拟器的性能。 (英语) Zbl 1198.82067号

摘要:本初步研究考虑了有限元半导体器件模拟器在一组具有非均匀内存访问计算节点的多锁、多核体系结构上的缩放和性能。这些多核架构包括两个带有多核处理器的linux集群:一个四插槽四核AMD Opteron平台和一个双插槽四核Intel Xeon Nehalem平台;和一个双座六核AMD Opteron工作站。这些平台具有复杂的内存层次结构,包括基于本地核心的缓存、基于本地套接字的内存、从另一个套接字访问同一主板上的内存,以及通过网络链接访问不同节点的内存。本研究中使用的特定半导体器件模拟器采用带区域分解和多级预处理的全耦合Newton-Krylov解算器。显示的缩放结果包括4096个核上1亿多个未知项的大规模问题,以及与Cray XT3/4 Red Storm能力平台的比较。虽然用于此工作的MPI-only设备模拟器可以利用四核和六核CPU的所有内核,但线性系统求解的效率随着内核数的增加而降低,最终需要不同的编程范式。

MSC公司:

82天37分 半导体统计力学
2005年5月 并行数值计算
65H10型 方程组解的数值计算
82-08 计算方法(统计力学)(MSC2010)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] H.Simon,T.Zacharia,R.Stevens,《能源与环境的exascale建模与仿真》。技术报告<http://www.er.doe.gov/ascr/ProgramDocuments/ProgDocs.html>;H.Simon,T.Zacharia,R.Stevens,《能源与环境的exascale建模与仿真》。技术报告<http://www.er.doe.gov/ascr/ProgramDocuments/ProgDocs.html>
[2] Heroux,M.A.,可扩展多核架构上数字库的设计问题,《物理杂志:会议系列》,125,1-11(2008)
[3] 林,P.T。;沙迪德,J.N。;萨拉,M。;杜米纳罗,R.S。;Hennigan,G.L。;Hoekstra,R.J.,用于稳定有限元半导体器件建模的并行代数多级预处理器的性能,计算物理杂志,2286250-6267(2009)·Zbl 1175.82077号
[4] J.N.Shadid、R.P.Pawlowski、J.W.Banks、L.Chacon、P.T.Lin、R.S.Tuminaro,《利用稳定有限元方法实现可扩展的全隐式全耦合电阻磁流体力学公式》,《计算物理杂志》,提交出版。;J.N.Shadid、R.P.Pawlowski、J.W.Banks、L.Chacon、P.T.Lin、R.S.Tuminaro,《利用稳定有限元方法实现可扩展的全隐式全耦合电阻磁流体力学公式》,《计算物理杂志》,提交出版·Zbl 1425.76312号
[5] Quarteroni,A。;Valli,A.,《偏微分方程的区域分解方法》(1999),牛津大学出版社:牛津大学出版社·Zbl 0931.65118号
[6] B.史密斯。;比约斯塔德,P。;Gropp,W.,《区域分解:椭圆偏微分方程的并行多层方法》(1996),剑桥大学出版社·Zbl 0857.65126号
[7] 萨拉,M。;Formaggia,L.,基于区域分解的预条件器的代数粗网格算子,(Wilders,P.;Ecer,A.;Periaux,J.;Satofuka,N.;Fox,P.,《并行计算流体动力学-实践与理论》(2002),爱思唯尔科学:荷兰爱思唯尔科学),119-126
[8] 萨拉,M。;沙迪德,J.N。;Tuminaro,R.S.,基于聚合的区域分解预条件的改进收敛界,SIAM矩阵分析杂志,27,3,744-756(2006)·Zbl 1105.65116号
[9] 萨拉,M。;Tuminaro,R.S.,非对称线性系统的新型Petrov-Galerkin平滑聚集预条件,SIAM科学与统计杂志,31143-166(2008)·Zbl 1183.76673号
[10] 汤姆金斯,J.L。;Brightwell,R。;坎普,W.J。;Dosanjh,S。;Kelly,S.M。;林,P.T。;沃恩,C.T。;列夫斯克,J。;Tipparaju,V.,《红色风暴体系结构和多核处理器的早期经验》,《分布式系统与技术国际期刊》,1,2,74-93(2010)
[11] 凯文·克莱默(Kevin M.Kramer)。;尼古拉斯·W·。;Hitchon,G.,《半导体器件,模拟方法》(1997),普伦蒂斯·霍尔PTR
[12] Sze,S.M.,半导体器件物理(1981),John Wiley&Sons
[13] 休斯·T·J·R。;Brooks,A.,《具有不连续加权函数的Petrov-Galerkin方法的理论框架:流线逆风过程的应用》,(Gallagher,R.H.;等,《流体中的有限元》,第4卷(1982年),John Wiley&Sons),47-65
[14] 休斯·T·J·R。;Mallet,M。;Mizukami,A.,计算流体动力学的新有限元公式:II。超越SUPG,应用力学和工程中的计算机方法,54341-355(1986)·兹比尔0627.6074
[15] F.Shakib,可压缩Euler和Navier-Stokes方程的有限元分析。斯坦福大学应用数学系博士论文,1989年。;F.Shakib,可压缩Euler和Navier-Stokes方程的有限元分析。1989年,斯坦福大学应用数学系博士论文。
[16] 夏尔马,M。;Carey,G.F.,使用自适应细化和通量逆风的半导体器件模拟,IEEE计算机辅助设计汇刊,8,61590-598(1989)
[17] G.F.Carey、A.L.Pardhanani、S.W.Bova。半导体器件模拟的先进数值方法和软件方法,技术报告SAND2000-0763J,Sandia国家实验室,2000。;G.F.Carey、A.L.Pardhanani、S.W.Bova。半导体器件模拟的先进数值方法和软件方法,技术报告SAND2000-0763J,Sandia国家实验室,2000年。
[18] Knoll,D.A。;Keyes,D.E.,无Jacobian牛顿-克利洛夫方法:方法和应用调查,计算物理杂志,193,357-397(2004)·Zbl 1036.65045号
[19] 沙迪德,J.N。;塞林格,A.G。;Pawlowski,R.P。;林,P.T。;Hennigan,G.L。;杜米纳罗,R.S。;Lehoucq,R.B.,非线性稳态输运/反应系统的大尺度稳定有限元计算分析,应用力学与工程中的计算机方法,1951846-1871(2006)·Zbl 1178.76240号
[20] 林,P.T。;萨拉,M。;沙迪德,J.N。;Tuminaro,R.S.,不可压缩流动和输运的完全耦合代数区域分解预处理器的性能,国际工程数值方法杂志,67,208-225(2006)·Zbl 1110.76315号
[21] Saad,Y.,《稀疏线性系统的迭代方法》(2003),SIAM·兹比尔1002.65042
[22] 西蒙西尼,V。;Szyld,D.B.,线性系统Krylov子空间方法的最新计算发展,数值线性代数及其应用,14,1,1-59(2007)·Zbl 1199.65112号
[23] 杜米纳罗,R.S。;Tong,C.H。;沙迪德,J.N。;Devine,K.D。;Day,D.M.,关于非结构化网格Krylov解算器的多级预处理模块:两级Schwarz,工程中数值方法的通信,18,383-389(2002)·Zbl 0999.65101号
[24] M.W.Gee、C.M.Siefert、J.J.Hu、R.S.Tuminaro、M.G.Sala,ML 5.0平滑聚合用户指南,技术报告SAND2006-2649,桑迪亚国家实验室,2006年。;M.W.Gee、C.M.Siefert、J.J.Hu、R.S.Tuminaro、M.G.Sala,ML 5.0平滑聚合用户指南,技术报告SAND2006-2649,桑迪亚国家实验室,2006年。
[25] B.Hendrickson,R.Leland,Chaco用户指南1.0版,技术报告SAND93-2339,Sandia National Laboratories,Albuquerque NM,871851993。;B.Hendrickson,R.Leland,Chaco用户指南1.0版,技术报告SAND93-2339,Sandia National Laboratories,Albuquerque NM,871851993。
[26] Axelsson,O.,《迭代求解方法》(1994),剑桥大学出版社:剑桥大学出版社,纽约·Zbl 0795.65014号
[27] 沙迪德,J.N。;杜米纳罗,R.S。;Devine,K.D。;Henningan,G.L。;Lin,P.T.,有限元传输/反应模拟中全耦合区域分解预处理器的性能,计算物理杂志,205,1,24-47(2005)·Zbl 1087.76069号
[28] 美国特罗滕贝格。;Oosterlee,C。;Schüller,A.,Multigrid(2001),学术出版社:伦敦学术出版社·Zbl 0976.65106号
[29] 威廉·布里格斯(William L.Briggs)。;范·埃姆登(Van Emden Henson);Steve McCormick,《多重网格教程》(2000),SIAM:SIAM Philadelphia·Zbl 0958.65128号
[30] M.萨拉。领域分解预条件:理论性质,在可压缩欧拉方程中的应用,并行方面。博士论文,EPFL,瑞士洛桑,2003年。;M.萨拉。区域分解预条件:理论性质,在可压缩欧拉方程中的应用,并行方面。博士论文,EPFL,瑞士洛桑,2003年。
[31] 萨拉,M。;林,P.T。;沙迪德,J.N。;Tuminaro,R.S.,拉伸网格上非对称偏微分方程的代数多级预处理器,(Widlund,Olof B.;Keyes,David E.,科学和工程领域分解方法XVI.科学和工程领域分解方法XVI,计算科学和工程讲义,第55卷(2006),Springer Verlag), 741-748
[32] 范·克,P。;曼德尔,J。;Brezina,M.,二阶和四阶椭圆问题的光滑聚合代数多重网格,计算,56179-196(1996)·Zbl 0851.65087号
[33] 范·克,P。;布雷齐纳,M。;Mandel,J.,基于平滑聚合的代数多重网格收敛,数值数学,88,559-579(2001)·Zbl 0992.65139号
[34] R.Tuminaro,J.Hu,M.Gee,C.Siefert,M.Sala,ML:多级预处理包:网页,2009年<http://trilinos.sandia.gov/packages/ml/>;R.Tuminaro,J.Hu,M.Gee,C.Siefert,M.Sala,ML:多级预处理包:网页,2009年<http://trilinos.sandia.gov/packages/ml/>
[35] Ruge,J。;Stüben,K.,代数多重网格(AMG),(McCormick,S.F.,多重网格方法,应用数学前沿,第3卷(1987),SIAM:SIAM费城,PA),73-130·Zbl 0659.65094号
[36] G.Karypis,V.Kumar,并行多级(k\);G.Karypis,V.Kumar,并行多电平·Zbl 0918.68073号
[37] M.Heroux、R.Bartlett、V.Howle、R.Hoekstra、J.Hu、T.Kolda、R.Lehoucq、K.Long、R.Pawlowski、E.Phipps、A.Salinger、H.Thornquist、R.Tuminaro、J.Willenbring、A.Williams,《Trilinos概述》,技术报告SAND2003-2927,桑迪亚国家实验室,2003年。;M.Heroux、R.Bartlett、V.Howle、R.Hoekstra、J.Hu、T.Kolda、R.Lehoucq、K.Long、R.Pawlowski、E.Phipps、A.Salinger、H.Thornquist、R.Tuminaro、J.Willenbring、A.Williams,《Trilinos概述》,技术报告SAND2003-2927,桑迪亚国家实验室,2003年。
[38] M.Heroux,Epetra线性代数服务包,网站:<http://trilinos.sandia.gov/packages/epetra>;M.Heroux,Epetra线性代数服务包,网站:<http://trilinos.sandia.gov/packages/epetra>
[39] 沙迪德,J.N。;哈钦森,S.A。;Hennigan,G.L。;香港莫菲特。;Devine,K.D。;塞林格,A.G.,非结构化有限元反应流解的高效并行计算,并行计算,231307-1325(1997)·Zbl 0894.68019号
[40] H.Tadano,在多核处理器上用块Krylov子空间方法加速收敛,in:在流动问题有限元国际会议(FEF09)上的发言,日本东京,2009年4月1日至3日。;H.Tadano,在多核处理器上用块Krylov子空间方法加速收敛,载于:在流动问题有限元国际会议(FEF09)上的发言,日本东京,2009年4月1日至3日。
[41] M.Sala,M.Heroux,《使用IFPACK 3.0的稳健代数预条件器》,技术报告SAND2005-0662,Sandia National Laboratories,Albuquerque,NM,871852005。;M.Sala,M.Heroux,《使用IFPACK 3.0的稳健代数预处理器》,技术报告SAND2005-0662,Sandia国家实验室,新墨西哥州阿尔伯克基,871852005年。
[42] R.S.Tuminaro,M.Heroux,S.A.Hutchinson,J.N.Shadid,阿兹特克用户指南2.1版,技术报告SAND99-8801J,桑迪亚国家实验室,阿尔伯克基NM,871851999年11月。;R.S.Tuminaro,M.Heroux,S.A.Hutchinson,J.N.Shadid,阿兹特克用户指南2.1版,技术报告SAND99-8801J,桑迪亚国家实验室,阿尔伯克基NM,871851999年11月。
[43] M.Heroux,AztecOO用户指南,技术报告SAND2007-3796,Sandia国家实验室,2007年。;M.Heroux,AztecOO用户指南,技术报告SAND2007-3796,Sandia国家实验室,2007年。
[44] Davis,T.A.,《稀疏线性系统的直接方法》(2006),SIAM·Zbl 1119.65021号
[45] G.Karypis,V.Kumar,ParMETIS:并行图划分和稀疏矩阵排序库,技术报告97-060,明尼苏达大学计算机科学系,1997年。;G.Karypis,V.Kumar,ParMETIS:并行图划分和稀疏矩阵排序库,技术报告97-060,明尼苏达大学计算机科学系,1997年。
[46] P.T.Lin、J.N.Shadid、R.S.Tuminaro、M.Sala。用于半导体器件漂移扩散方程有限元建模的Petrov-Galerkin代数多层预处理器的性能。IJNME出版社,在线发表于Wiley InterScience(<www.InterScience.Wiley.com>);P.T.Lin,J.N.Shadid,R.S.Tuminaro,M。萨拉。用于半导体器件漂移扩散方程有限元建模的Petrov-Galerkin代数多层预处理器的性能。IJNME出版社,在线发表于Wiley InterScience(<www.InterScience.Wiley.com>·Zbl 1202.82003年
[47] P.T.Lin,J.N.Shadid,四插槽/四核InfiniBand平台上仅支持MPI的半导体设备模拟器的性能,技术报告SAND2009-0179,桑迪亚国家实验室,2009年1月。;P.T.Lin,J.N.Shadid,《四插槽/四核InfiniBand平台上仅支持MPI的半导体设备模拟器的性能》,技术报告SAND2009-0179,桑迪亚国家实验室,2009年1月。
[48] 贝克,C.G。;Heroux,硕士。;爱德华兹,H.C。;Williams,A.B.,便携式多核编程的轻量级API(PDP2010(2010),IEEE)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。