吻,艾姆雷;Pávó,若泽夫;萨博尔斯·吉莫西 使用CUDA的力矩加速法。 (英语) 兹比尔1360.65336 COMPEL公司 30,第6期,1751-1762(2011). 总结:目的{}-本文的目的是加速组装阻抗矩阵这一耗时的任务,该阻抗矩阵是通过矩量法离散积分方程而得到的,并使用大规模并行处理方案进行加速。{}设计/方法/方法{}-本文提供了在具有计算统一设备架构(CUDA)功能的通用视频卡上实现矩量法的几种方法,并给出了一般的实现设计模式和对该主题的良好概述。{}调查结果{}-根据所给出的数值结果,所提出的方法似乎是有效的。{}创意/价值{}-本论文的主题是计算技术中一个不断发展的、相当新的方面,这可能会引起科学界的高度兴趣。 引用于1文件 MSC公司: 第65年 并行数值计算 关键词:CUDA公司;涡流测试;GPGPU(通用图形处理器);平行矩量法;计算架构图;计算机硬件;矩量法 软件:库拉;CUDA公司 PDF格式BibTeX公司 XML格式引用 \textit{I.Kiss}等人,COMPEL 30,No.6,1751--1762(2011;Zbl 1360.65336) 全文: 内政部 参考文献: [1] Bowler,J.(1994),“与理想裂纹I的涡流相互作用。正向问题”,J.Appl。《物理学》第75卷第11期,第8128-37页·Zbl 1360.65336号 ·doi:10.1108/03321641111168075 [2] CUDA(2011),NVIDIA CUDA Compute Unified Device Architecture Programming Guide,NVIDI A Corporation,网址:。 [3] CULA(2011),CULA Tools,CUDA加速LApack库(CULA),参考指南,网址:。 [4] David,K.和Wen-mei,H.(2010),《大规模并行处理器编程,实践方法》,Morgan Kaufmann,San Fransisco,CA。 [5] Garland,M.、Le Grand,S.、Nickolls,J.、Anderson,J.和Hardwick,J.,Morton,S.,Phillips,E.、Zhang,Y.和Volkov,V.(2008),“CUDA的并行计算经验”,Micro,IEEE,第28卷第4期,第13-27页·Zbl 1360.65336号 ·doi:10.1108/03321641111168075 [6] Hackbusch,W.,Khoromskij,B.和Kriemann,R.(2005),“基于H矩阵近似的区域分解直接schur补码方法”,《科学计算与可视化》,第8卷,第179-88页·Zbl 1066.65143号 ·doi:10.1108/03321641111168075 [7] Halfhill,T.R.(2008),“CUDA并行处理”,《微处理器报告》,第22卷第1期,第1-8页。 [8] Junichiro Makino,M.T.(1998),科学模拟专用计算机-GRAPE系统,奇切斯特威利·兹比尔0899.68123 [9] Kiss,I.、Pávó,J.和Gyimóthy,S.(2011),“使用CUDA并行计算裂纹信号”,电磁无损评估XIV,应用电磁学和力学研究,IOS出版社,伦敦·Zbl 1360.65336号 [10] Koczka,G.、Kiss,I.、Bauernfeind,T.、Preis,K.和Bíró,O.(2010),“GPU加速的基于区域分解的方法,用于解决波传播问题”,IGTE 2010,第7页,摘要。 [11] Pávó,J.(2000),“使用ECT阻抗数据重建板试样中的裂纹组”,载于Udpa,S.S.、Takagi,T.、Pavo,J.和Albanese,R.(编辑),《电磁无损评估》,第四卷,阿姆斯特丹IOS出版社,第204-11页。 [12] Pavo,J.和Lesselier,D.(2006),“用整体近似计算涡流检测探针信号”,IEEE磁学汇刊,第42卷第4期,第1419-22页·兹比尔1360.65336 ·doi:10.1108/03321641111168075 [13] Rivera-Polanco,D.A.(2009年),“NVIDIA CUDA GPU上的集体通信和屏障同步”,肯塔基州列克星敦市肯塔基大学博士论文。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。