×

基于GPGPU的并行计算在使用共轭梯度算法的有限元中的应用:综述。 (英语) Zbl 1397.65337号

摘要:十多年来,科学和高性能计算界一直在考虑有限元方法(FEM)的并行化。FEM中的大多数计算都与线性代数有关,其中包括矩阵和向量计算。这些操作具有单指令多数据(SIMD)计算模式,这对共享内存并行体系结构非常有益。自2007年以来,通用图形处理单元(GPGPU)被有效地用于FEM计算的并行化。有限元法的求解步骤通常使用共轭梯度(CG)型迭代方法进行,因为它们具有较大的收敛速度和较大的并行化机会。虽然FEM中的SIMD计算模式对于GPU计算来说是固有的,但也存在一些缺陷,例如线程利用率不足、内存访问不平衡、算术强度较低、GPU上的快速内存有限以及同步。然而,在过去10年中,FEM应用程序已成功部署在GPU上,以实现显著的性能改进。本文全面回顾了有限元法每个步骤中应用的并行优化策略。本文还讨论了与FEM中每个步骤相关的陷阱和权衡。此外,还讨论了一些利用GPU巨大计算能力的非凡方法。建议的审查不限于单个工程领域。相反,它适用于需要基于FEM的仿真的所有工程和科学领域。

MSC公司:

2005年5月 并行数值计算
65N30型 含偏微分方程边值问题的有限元、Rayleigh-Ritz和Galerkin方法
65M60毫米 涉及偏微分方程初值和初边值问题的有限元、Rayleigh-Ritz和Galerkin方法
65-02 与数值分析有关的研究论述(专著、调查文章)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Zienkiewicz O C、Taylor R L和Nithiarasu P 2000年有限元法:固体力学,第2卷。牛津:巴特沃斯·海尼曼
[2] 辛格,IV;米什拉,BK;布拉曼卡尔,M;巴辛,V;夏尔马,K;Khan,IA,使用EFGM和FEM耦合的三维裂纹数值模拟,国际计算机杂志。方法工程科学。机械。,15, 227-231, (2014) ·doi:10.1080/15502287.2014.882438
[3] Jin J M 2015年电磁学中的有限元方法第三版,纽约:John Wiley&Sons
[4] 道达尔D 2012有限元分析——从生物医学应用到工业发展伦敦:InTech·doi:10.5772/2552
[5] Argyris J 1954和1955能量定理和结构分析。飞机工程1990年重印伦敦:巴特沃斯科学出版物
[6] Clough W R 1960平面应力分析中的有限元方法。在:第二届电子计算会议记录宾夕法尼亚州匹兹堡A.S.C.E.结构部
[7] 巴纳ś,K;Płaszewski,P;Macoił,P,高阶有限元GPU上的数值积分,计算。数学。申请。,67, 1319-1344, (2014) ·Zbl 1382.65064号 ·doi:10.1016/j.camwa.2014.01.021
[8] 科马提奇,D;米歇,D;Erlebacher,G,使用CUDA将高阶有限元地震建模应用程序移植到NVIDIA图形卡,J.Parallel Distrib.Comput。,69, 451-460, (2009) ·doi:10.1016/j.jpdc.2009.01.006
[9] 东加拉J稀疏矩阵存储格式综述www.netlib.org/utk/papers/templates/node90.html(2017年5月10日访问)
[10] Bell N和Garland M 2008CUDA上的高效稀疏矩阵向量乘法Nvidia公司NVR-2008-004技术报告
[11] Barrett R、Berry M、Chan T F、Demmel J、Donato J、Dongarra J、Eijkhout V、Pozo R、Romine C和Van der Vorst H 1994线性系统解的模板:迭代方法的构建块,第二版,工业和应用数学学会,宾夕法尼亚州费城·Zbl 0814.65030号 ·doi:10.1137/1.9781611971538
[12] 凯里,GF;Jiang,B,Element-by-Element线性和非线性求解方案,Commun。申请。数字。方法,2145-153,(1986)·Zbl 0591.65075号 ·doi:10.1002/cnm.1630020205
[13] 凯里,GF;巴拉吉,E;麦克雷,R;Sharma,M,元素-八元向量和并行计算,Commun。申请。数字。方法,4299-307,(1988)·Zbl 0638.73042号 ·doi:10.1002/cnm.1630040303
[14] Nickolls J和Kirk D 2009图形和计算GPU。收件人:Patterson D A和Hennessy J L计算机组织和设计,第4版,附录A:1-77
[15] NVIDIA CUDA 2007年计算统一设备架构编程指南. http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html(2017年9月23日访问)
[16] JD欧文斯;卢贝克,D;Govindaraju,N;哈里斯,M;Krüger,J;Lefohn,AE;Purcell,TJ,图形硬件通用计算综述,计算。图表。论坛,26,80-113,(2007)·文件编号:10.1111/j.1467-8659.2007.01012.x
[17] Liu Y,Jiao S,Wu W和De S 2008 GPU加速了快速有限元变形模拟。在:亚太电路与系统会议记录,APCCAS 2008,IEEE澳门,第606-609页
[18] 卡凯,A;威斯特伐尔,E;Hertel,R,用图形处理单元加速FEM微磁模拟,IEEE Trans。马格纳。,46, 2303-2306, (2010) ·doi:10.1109/TMAG.2010.2048016
[19] 布罗德科布,AR;哈根,TR;Stra,ML,图形处理单元(GPU)编程策略和GPU计算趋势,J.Parallel Distribute.Compute。,73,4-13,(2013)·doi:10.1016/j.jpdc.2012.04.003
[20] 挂钩,SRH;VU卡提克;西瓦苏坦,S;拉胡南珊,A;Tyagarajan,RS;Jayakumar,P,《有限元、设计优化和无损评估:基于GPU的元素耦合优化和无损检测的磁学回顾和未来方向》,国际J.Appl。电动发电机。机械。,47, 607-627, (2015)
[21] Sanders J和Kandrot E,2010年CUDA示例:通用GPU编程简介马萨诸塞州:Addison-Wesley Professional
[22] Ho-Le,K,有限元网格生成方法:综述和分类,计算。辅助设计。,20, 27-38, (1988) ·Zbl 0661.65124号 ·doi:10.1016/0010-4485(88)90138-8
[23] 西瓦苏坦,S;VU卡提克;贾库马尔,P;Thyagarajan,RS;Udpa,L;Hoole,SRH,用于GPU设计和NDE的基于脚本的参数化有限元网格,IETE技术版本,32,94-103,(2015)·doi:10.1080/02564602.2014.983192
[24] Reddy J N 1993年有限元法简介第2版,纽约:McGraw-Hill,第2卷,第2.2号
[25] MJ Garcia-Ruiz;Steven,GP,弹性问题中的固定网格有限元,工程计算。,16, 145-164, (1999) ·Zbl 0948.74059号 ·doi:10.1108/02644409910257430
[26] 克鲁埃尔,F;Bana sh,K,高阶有限元数值积分的矢量化opencl实现,计算。数学。申请。,66, 2030-2044, (2013) ·Zbl 1350.65126号 ·doi:10.1016/j.camwa.2013.08.026
[27] Solin P、Segeth K和Dolezel I,2003年高阶有限元方法博卡拉顿:查普曼与霍尔出版社,CRC出版社
[28] 马西奥,P;Płaszewski,P;Bana sh,K,基于gpu的三维有限元数值积分,Procedia Comput。科学。,1, 1093-1100, (2010) ·Zbl 1382.65064号 ·doi:10.1016/j.procs.2010.04.121
[29] FilipovićJ、Peterlík I和Fousek J 2009有限元方法中方程组的GPU加速-消除结果。在:HPC应用加速器研讨会论文集(SAAHPC)
[30] Dziekonski,A;Sypek,P;拉梅基,A;Mrozowski,M,基于GPU的有限元矩阵生成中的精度、内存和速度策略,IEEE天线布线。传播。莱特。,11, 1346-1349, (2012) ·Zbl 1352.65494号 ·doi:10.1109/LAWP.20122.227449
[31] Dziekonski,A;西佩克,P;拉梅基,A;Mrozowski,M,《在多个图形处理器上生成大型有限元矩阵》,国际期刊Numer。方法工程,94,204-220,(2013)·Zbl 1352.65494号 ·doi:10.1002/nme.4452
[32] Nvidia Corporation 2008古巴图书馆。加利福尼亚州圣克拉拉NVIDIA 2.0版
[33] Dziekonski,A;Sypek,P;拉梅基,A;Mrozowski,M,GPU上的有限元矩阵生成,Prog。电动发电机。第128249-265号决议(2012年)·Zbl 1352.65494号 ·doi:10.2528/PIER12040301
[34] Munshi A、Gaster B R、Mattson T G、Fung J和Ginsburg D 2011 OpenCL编程指南。伦敦:培生教育
[35] 巴纳西,K;克鲁埃尔,F;Bielanáski,J,多核结构上一阶近似的有限元数值积分,计算。方法应用。机械。工程,305827-848,(2016)·doi:10.1016/j.cma.2016.03.038
[36] Woźniak,M,使用任务依赖图的等几何有限元方法求解器的快速GPU积分算法,J.Compute。科学。,11, 145-152, (2015) ·doi:10.1016/j.jocs.2015.02.007
[37] Mamza J、Makyla P、Dziekonski A、Lamecki A和Mrozowski M 2012有限元法中数值积分的多核和多处理器实现。在:第19届微波、雷达和无线通信国际会议记录,IEEE,华沙,第2卷,第457-461页
[38] Knepley,MG;Terrel,AR,gpus上的有限元集成,ACM Trans。数学。柔和。(TOMS),39,10:1-10:13,(2013)·Zbl 1298.65176号 ·doi:10.1145/2427023.2427027
[39] 塞卡,C;卢,A;Darve,E,《有限元方法在图形处理器上的组装简介》,IOP Conf.Ser。马特。科学。工程,2009年1月10日,(2010年)·Zbl 1217.80146号 ·doi:10.1088/1757-899X/10/1/012009
[40] 岩田,T;Shimasaki,M,有限元分析中并行ICCG求解器的代数多色排序,IEEE Trans。马格纳。,38, 429-432, (2002) ·doi:10.1109/20.996114
[41] 岩田,T;Shimasaki,M,具有快速收敛和低通信成本的并行ICCG求解器的代数块红黑排序方法,IEEE Trans。马格纳。,39, 1713-1716, (2003) ·doi:10.1109/TMAG.2003.810531
[42] 傅,Z;刘易斯,TJ;RM Kirby;Whitaker,RT,《为GPU构建有限元方法管道》,J.Compute。申请。数学。,257, 195-211, (2014) ·兹比尔1291.65397 ·doi:10.1016/j.cam.2013.09.001
[43] 塞卡,C;卢,AJ;Darve,E,《有限元方法在图形处理器上的组装》,国际期刊Numer。方法工程,85,640-669,(2011)·Zbl 1217.80146号 ·doi:10.1002/nme.2989
[44] 马卡尔,GR;哈姆,DA;Kelly Paul,HJ,从高级规范为GPU生成优化的有限元解算器,Procedia Compute。科学。,1815-1823年(2010年)·doi:10.1016/j.procs.2010.04.203
[45] 马卡尔,GR;苗条,A;哈姆,DA;凯利,PHJ;坎特威尔,CD;Sherwin,SJ,《多核和多核体系结构的有限元组装策略》,国际期刊Numer。《液体方法》,71,80-97,(2013)·doi:10.1002/fld.3648
[46] Sanfui S和Sharma D 2017基于双内核的策略,用于在图形处理单元上的有限元分析中执行装配。在:IEEE机械、工业、自动化和管理系统(AMIAMS)进展国际会议记录,第1-9页
[47] Cecka C、Lew A和Darve E 2011有限元方法在实时弹性动力学图形处理器上的组装应用。在:GPU计算宝石Jade主编,马萨诸塞州:Morgan Kaufmann,第16章,第187-205页·Zbl 1217.80146号
[48] 孟,HT;聂,BL;Wong,S;梅肯,C;Jin,JM,GPU电磁分析有限元加速计算,IEEE天线传播。Mag.,56,39-62,(2014)·doi:10.1109/MAP.2014.6837065
[49] 伊利诺伊州雷古利;Giles,MB,《图形处理单元上的有限元算法和数据结构》,《国际并行程序》。,43, 203-239, (2015) ·doi:10.1007/s10766-013-0301-6
[50] Dziekonski,A;Sypek,P;拉梅基,A;Mrozowski,M,GPU加速的无损、有损和张量介质有限元矩阵生成,IEEE天线传播。Mag.,56,186-197,(2014)·Zbl 1352.65494号 ·doi:10.1109/MAP.2014.6971943
[51] Dziekonski,A;Sypek,P;拉梅基,A;Mrozowski,M,《使用多GPU工作站进行有限元电磁模拟的通信和负载平衡优化》,IEEE Trans。微型。理论技术,65,2661-2671,(2017)·doi:10.1010/TMTT.2017.2714670
[52] Logg A、Mardal M A和Wells G N 2012用有限元法自动求解微分方程:FEniCS书籍,第84卷。纽约-海德堡-德勒支-伦敦:施普林格·Zbl 1247.65105号
[53] Dupont T、Hoffman J、Jansson J、Johnson C、Kirby Robert C、Knepley M、Larson M、Logg A和Scott R,2003年击剑项目。技术代表200321,Chalmers有限元中心预印系列
[54] Luporini F、Varbanescu A L、Rathgeber F、Bercea G T、Ramanujam J、Ham D A和Kelly P H J 2014 COFFEE:有限元局部装配的优化编译器。arXiv预打印arXiv:1407.0904
[55] Shewchuk J R 1994年介绍无痛苦的共轭梯度法技术报告CMU-CS-94-125,卡内基梅隆大学计算机科学学院,宾夕法尼亚州匹兹堡
[56] 伊图,LM;苏秋,C;莫尔多瓦努,F;Postelnicu,A,特斯拉架构gpus单浮点和双浮点精度性能的比较,Bull。Transilv公司。布拉索夫州立大学。I工程科学。,4, 131-138, (2011)
[57] Göddeke,D;斯特罗德卡,R;Turek,R,《有限元模拟中面向硬件的本机、仿真和混合精度求解器的性能和准确性》,国际期刊《并行应急分布系统》。,22, 221-256, (2007) ·Zbl 1188.68084号 ·网址:10.1080/17445760601122076
[58] 巴波林,M;Buttari,A;Dongarra,J;Kurzak,J;兰古,J;卢古朱利安;Luszczek,P;托莫夫,S,用混合精度算法加速科学计算,计算。物理学。社区。,180, 2526-2533, (2009) ·Zbl 1197.65240号 ·doi:10.1016/j.cpc.2008.11.005
[59] Buttari A、Dongarra J、Kurzak J、Langou Julie、Langou-Julien、Luszczek P和Tomov S 2006在科学计算中开发混合精度浮点硬件。在:高性能计算研讨会会议记录,第19-36页·Zbl 1197.65240号
[60] Göddeke D、Strzodka R和Turek S 2005使用GPU加速双精度FEM模拟。在:ASIM第18届仿真技术研讨会论文集
[61] 科斯格罗夫,JDF;迪亚斯,JC;Griewank,A,稀疏线性系统的近似逆预处理,国际计算杂志。数学。,44, 91-110, (1992) ·Zbl 0762.65025号 ·doi:10.1080/0207169208804097
[62] 李,R;Saad,Y,GPU加速预处理迭代线性解算器,J.Supercomput。,63, 443-466, (2013) ·doi:10.1007/s11227-012-0825-3
[63] Naumov M、Chien L S、Vandermersch P和Kapasi U 2010 Cuspare库。演示地点:圣何塞GPU技术会议
[64] Wang E,Zhang Q,Shen B,Zhang G,Lu X,Wu Q和Wang Y 2014英特尔数学内核库。在:Intel上的高性能计算®至强融核\(^{TM}.\)斯普林格国际出版公司,第167-188页
[65] Naumov M 2011年使用CUSPARSE和CUBLAS的不完全LU和Cholesky预处理迭代方法英伟达技术报告和白皮书
[66] 费亚尔科,SY;Zeglen,F,在CPU和GPU上求解大型有限元问题的预处理共轭梯度法,J.Telecommon。技术信息。,2, 26-33, (2016)
[67] 高,J;梁,R;王,J,基于GPU的改进不完全Cholesky预条件共轭梯度算法研究,J.并行分布计算。,74, 2088-2098, (2014) ·doi:10.1016/j.jpdc.2013.10.002
[68] 本齐,M;梅耶,CD;Tůma,M,共轭梯度法的稀疏近似逆预条件,SIAM J.Sci。计算。,17, 1135-1149, (1996) ·Zbl 0856.65019号 ·doi:10.1137/S1064827594271421
[69] 格罗特,MJ;Huckle,T,稀疏近似逆的并行预处理,SIAM J.Sci。计算。,1838-853,(1997年)·Zbl 0872.65031号 ·doi:10.1137/S1064827594276552
[70] Ament M、Knittel G、Weiskopf D和Straßer W 2010多GPU平台上泊松问题的并行预处理共轭梯度求解器。在:第18届并行、分布式和网络化处理欧洲微观会议记录,IEEE,第583-592页
[71] 赫尔芬斯坦,R;Koko,J,GPU上的并行预处理共轭梯度算法,J.Compute。申请。数学。,236, 3584-3590, (2012) ·Zbl 1245.65034号 ·doi:10.1016/j.cam.2011.04.025
[72] Gravvanis,GA,显式近似逆预处理技术,Arch。计算。方法工程,9,371-402,(2002)·Zbl 1032.65046号 ·doi:10.1007/BF03041466
[73] 乔治亚州格拉夫瓦尼斯;帕帕佐普洛斯Filelis Papadopoulos,CK;Giannoutakis,KM,在GPU上求解有限差分线性系统:基于CUDA的并行显式预处理双共轭共轭梯度型方法,J.Supercomput。,61, 590-604, (2012) ·doi:10.1007/s11227-011-0619-z
[74] 卡特希尔,E;麦基,J;Rose,DJ(编辑);Willoughby,RA(编辑),减少矩阵带宽的几种策略,157-166,(1972),纽约·doi:10.1007/978-1-4615-8675-3_14
[75] K藤原;Nakata,T;Fusayasu,H,ICCG方法的收敛加速特性,IEEE Trans。马格纳。,29, 1958-1961, (1993) ·数字对象标识代码:10.1109/20.250792
[76] De,Camargos A F P;VC Silva;吉咪·圭雄;Munier,G,用于高耗散介质电磁场有限元建模的GPU高效并行预处理共轭梯度求解器,IEEE Trans。马格纳。,50, 569-572, (2014) ·doi:10.1109/TMAG.2013.285091
[77] 伯纳西,M;比森,M;Fantozzi,C;Janna,C,图形处理单元上的分解稀疏近似逆预处理共轭梯度解算器,SIAM J.Sci。计算。,38,c53-c72,(2016)·Zbl 1336.65036号 ·doi:10.1137/15M1027826
[78] Bell N和Garland M 2017https://code.google.com/archive/p/cusp-library/downloads(6月23日访问)
[79] Monakov A和Avetisyan A 2009在NVIDIA GPU上实现分块稀疏矩阵向量乘法。嵌入式计算机系统:体系结构、建模和仿真第289-297页
[80] Choi,JW;辛格,A;Vuduc,RW,gpu上稀疏矩阵向量乘法的模型驱动自动调谐,ACM Sigplan Not。,45, 115-126, (2010) ·doi:10.1145/1837853.1693471
[81] 巴斯克斯,F;Fernández,JJ;Garzón,EM,NVIDIA gpus上稀疏矩阵向量乘积的新方法,Concurr。计算。实际。有效期:23815-826(2011年)·doi:10.1002/cpe.1658
[82] 毕切尔,JC;里维拉,FF;费尔南德斯,M;Rodríguez,A,使用gpu上的重新排序技术优化稀疏矩阵-向量乘法,微过程。微晶。,36, 65-77, (2012) ·doi:10.1016/j.micpro.2011.05.005
[83] 危险,高压;Schmidt,B,支持CUDA的gpu上稀疏矩阵向量乘法的切片COO格式,Procedia Compute。科学。,9, 57-66, (2012) ·doi:10.1016/j.procs.2012.04.007
[84] Dang,高压;Schmidt,B,使用原子操作在GPU上支持CUDA的稀疏矩阵向量乘法,并行计算。,39, 737-750, (2013) ·doi:10.1016/j.parco.2013.09.05
[85] 莫纳科夫,A;洛赫莫托夫,A;Avetisyan,A,针对GPU架构自动调整稀疏矩阵-矢量乘法,HiPEAC Proc。莱克特。注释计算。科学。,5952111-125(2010年)·数字对象标识代码:10.1007/978-3-642-11515-810
[86] Kreutzer,M;海格,G;Wellein,G;费斯克,H;Bishop,AR,一种统一的稀疏矩阵数据格式,用于在具有宽SIMD单元的现代处理器上进行有效的通用稀疏矩阵-向量乘法,SIAM J.Sci。计算。,36,c401-c423,(2014)·Zbl 1307.65055号 ·doi:10.1137/130930352
[87] Anzt H、Tomov S和Dongarra J为SELL-C/SELL-C实现稀疏矩阵向量乘积-\(σ \)NVIDIA GPU上的格式田纳西大学技术代表UT-EECS-14-727
[88] Filippone,S;卡德里尼,V;Barbieri,博士;Fanfarillo,A,gpgpus上的稀疏矩阵向量乘法,ACM Trans。数学。柔和。(TOMS),43,30,(2017)·Zbl 1380.65079号 ·数字对象标识代码:10.1145/3017994
[89] 高,J;王,Y;Wang,J,一种用于稀疏矩阵向量乘法的新型多图形处理单元并行优化框架,Concurr。计算。实际。Exp.,29,e3936,(2017年)·doi:10.1002/cpe.3936
[90] 高,J;周,Y;他,G;Xia,Y,预处理共轭梯度算法的多GPU并行优化模型,并行计算。,63, 1-16, (2017) ·doi:10.1016/j.parco.2017.04.003文件
[91] Flegar G和Quintana-OrtíE S在图形处理器上平衡CSR稀疏矩阵向量乘积。在:欧洲并行处理会议记录查姆:施普林格,第697-709页
[92] Merrill D和Garland M 2016基于合并的并行稀疏矩阵-向量乘法。在:高性能计算、网络、存储和分析国际会议记录犹他州盐湖城,第678-689页
[93] 杨,W;Li,K;李,K,CPUGPU异构计算系统上spmv的混合计算方法,J.并行分布计算。,104, 49-60, (2017) ·doi:10.1016/j.jpdc.2016.12.023
[94] 林,S;Xie,Z,多GPU集群上稀疏线性系统的Jacobi PCG解算器,J.Supercomput。,73, 433-454, (2017) ·doi:10.1007/s11227-016-1887-4
[95] Cevahir A、Nukada A和Matsuoka S 2009具有多个GPU的快速共轭梯度。在:国际计算科学会议记录,LNCS 5544。柏林-海德堡:施普林格,第893-903页
[96] 马丁内斯·弗鲁托斯,J;马丁内斯·卡斯特洪,PJ;Herrero-Pérez,D,有限元问题无装配迭代求解器的细粒度GPU实现,计算。结构。,157, 9-18, (2015) ·doi:10.1016/j.com.pstruc.2015.05.010
[97] 吻,我;吉莫西,S;Badics,Z,CUDA有限元技术的并行实现,IEEE Trans。马格纳。,48, 507-510, (2012) ·doi:10.1109/TMAG.2011.2175905
[98] Fernández,DM;德纳维,MM;总量,WJ;Giannacopoulos,D,FEM交替并行处理方法,IEEE Trans。马格纳。,48, 399-402, (2012) ·doi:10.1010/TMAG.2011.2173304
[99] 休斯,TJR;利未,I;Winget,J,结构和固体力学问题的一种单元求解算法,计算。方法应用。机械。工程师,36,241-254,(1983)·Zbl 0487.73083号 ·doi:10.1016/0045-7825(83)90115-9
[100] 严,X;韩,X;吴,D;谢,D;Bai,B;Ren,Z,基于EBE-FEM的预处理共轭梯度法及其在电磁场分析中的应用研究,IEEE Trans。马格纳。,53,1-4,(2017)·doi:10.1109/TMAG.2017.2657764
[101] Akbariyeh A、Dennis B H、Wang B P和Lawrence K L 2015三维结构有限元分析中基于GPU的并行装配和无装配稀疏矩阵向量乘法的比较。在:《第十五届土木、结构和环境工程计算国际会议论文集》,苏格兰斯特灵郡土木工程出版社
[102] 马丁内斯·弗鲁托斯,J;Herrero-Pérez,D,固定网格有限元分析的高效无矩阵GPU实现,有限元。分析。设计。,104, 61-71, (2015) ·doi:10.1016/j.finel.2015.06.005
[103] Bendsöe M P和Sigmund O 2004拓扑优化理论、方法和应用。柏林-海德堡:施普林格·Zbl 1059.74001号
[104] 马丁内斯·弗鲁托斯,J;马丁内斯·卡斯特洪,PJ;Herrero-Pérez,D,使用多层次粒度的GPU计算进行高效拓扑优化,高级工程软件。,106, 47-62, (2017) ·doi:10.1016/j.advengsoft.2017.01.009
[105] 马丁内斯·弗鲁托斯,J;Herrero-Pérez,D,使用等值面对连续体结构进行进化拓扑优化的GPU加速,Comput。结构。,182, 119-136, (2017) ·doi:10.1016/j.compstruc.2016.10.108
[106] 公羊,L;Sharma,D,用于结构拓扑优化的进化和GPU计算,Swarm Evol。计算。,35, 1-13, (2017) ·doi:10.1016/j.swevo.2016.08.004
[107] 马丁内斯·弗鲁托斯,J;Herrero-Pérez,D,使用多GPU系统的大规模鲁棒拓扑优化,计算。方法应用。机械。工程,311,393-414,(2016)·doi:10.1016/j.cma.2016.08.016
[108] Baca,V型;霍拉克,Z;Mikulenka,P;Dzupa,V,用于有限元分析的非均匀正交异性和各向同性材料模型的比较,医学工程物理。,30, 924-930, (2008) ·doi:10.1016/j.medengphy.2007.12.009
[109] 蔡,Y;李,G;Wang,H,使用GPU的隐式有限元方法的基于节点的并行求解方案,Procedia Eng.,61,318-324,(2013)·doi:10.1016/j.proeng.2013.08.022
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。