×

使用CUDA的力矩加速法。 (英语) 兹比尔1360.65336

总结:目的{}-本文的目的是加速组装阻抗矩阵这一耗时的任务,该阻抗矩阵是通过矩量法离散积分方程而得到的,并使用大规模并行处理方案进行加速。{}设计/方法/方法{}-本文提供了在具有计算统一设备架构(CUDA)功能的通用视频卡上实现矩量法的几种方法,并给出了一般的实现设计模式和对该主题的良好概述。{}调查结果{}-根据所给出的数值结果,所提出的方法似乎是有效的。{}创意/价值{}-本论文的主题是计算技术中一个不断发展的、相当新的方面,这可能会引起科学界的高度兴趣。

MSC公司:

第65年 并行数值计算

软件:

库拉CUDA公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bowler,J.(1994),“与理想裂纹I的涡流相互作用。正向问题”,J.Appl。《物理学》第75卷第11期,第8128-37页·Zbl 1360.65336号 ·doi:10.1108/03321641111168075
[2] CUDA(2011),NVIDIA CUDA Compute Unified Device Architecture Programming Guide,NVIDI A Corporation,网址:。
[3] CULA(2011),CULA Tools,CUDA加速LApack库(CULA),参考指南,网址:。
[4] David,K.和Wen-mei,H.(2010),《大规模并行处理器编程,实践方法》,Morgan Kaufmann,San Fransisco,CA。
[5] Garland,M.、Le Grand,S.、Nickolls,J.、Anderson,J.和Hardwick,J.,Morton,S.,Phillips,E.、Zhang,Y.和Volkov,V.(2008),“CUDA的并行计算经验”,Micro,IEEE,第28卷第4期,第13-27页·Zbl 1360.65336号 ·doi:10.1108/03321641111168075
[6] Hackbusch,W.,Khoromskij,B.和Kriemann,R.(2005),“基于H矩阵近似的区域分解直接schur补码方法”,《科学计算与可视化》,第8卷,第179-88页·Zbl 1066.65143号 ·doi:10.1108/03321641111168075
[7] Halfhill,T.R.(2008),“CUDA并行处理”,《微处理器报告》,第22卷第1期,第1-8页。
[8] Junichiro Makino,M.T.(1998),科学模拟专用计算机-GRAPE系统,奇切斯特威利·兹比尔0899.68123
[9] Kiss,I.、Pávó,J.和Gyimóthy,S.(2011),“使用CUDA并行计算裂纹信号”,电磁无损评估XIV,应用电磁学和力学研究,IOS出版社,伦敦·Zbl 1360.65336号
[10] Koczka,G.、Kiss,I.、Bauernfeind,T.、Preis,K.和Bíró,O.(2010),“GPU加速的基于区域分解的方法,用于解决波传播问题”,IGTE 2010,第7页,摘要。
[11] Pávó,J.(2000),“使用ECT阻抗数据重建板试样中的裂纹组”,载于Udpa,S.S.、Takagi,T.、Pavo,J.和Albanese,R.(编辑),《电磁无损评估》,第四卷,阿姆斯特丹IOS出版社,第204-11页。
[12] Pavo,J.和Lesselier,D.(2006),“用整体近似计算涡流检测探针信号”,IEEE磁学汇刊,第42卷第4期,第1419-22页·兹比尔1360.65336 ·doi:10.1108/03321641111168075
[13] Rivera-Polanco,D.A.(2009年),“NVIDIA CUDA GPU上的集体通信和屏障同步”,肯塔基州列克星敦市肯塔基大学博士论文。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。