×

用于GPU上基于物理的模拟的数据结构和转换。 (英语) Zbl 1323.65138号

JoséM.Laginha M.Palma(编辑)等人,《计算科学的高性能计算——VECPAR 2010》。第九届国际会议,美国加州伯克利,2010年6月22日至25日。修订了选定的论文。柏林:施普林格出版社(ISBN 978-3-642-19327-9/pbk)。计算机科学课堂讲稿6449162-171(2011)。
摘要:随着图形处理单元(GPGPU)上的通用计算的成熟,越来越多复杂的科学应用程序被瞄准利用GPU上可用的数据级并行性。在数据并行硬件上实现基于物理的模拟需要预处理开销,这会影响应用程序的性能。我们讨论了基于物理的数据结构的实现,这些结构在用于数据并行硬件时可以显著提高性能。这些数据结构使我们能够维护底层数据的基于物理的抽象,减少程序员的工作量,并获得比以前实现的GPU内核更快的速度。
关于整个系列,请参见[Zbl 1207.68016号].

MSC公司:

65日元10 特定类别建筑的数值算法
68第05页 数据结构
76米28 粒子法和晶格气体法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] NVIDIA:NVIDIA CUDA编程指南2.0(2008),http://www.nvidia.com/cuda
[2] NVIDIA:NVIDIA Physx(2008),http://www.nvidia.com/physx
[3] Nguyen,H.:Gpu gems 3。Addison-Wesley Professional,阅读(2007)
[4] Harris,M.:优化cuda中的并行还原,NVIDIA Developer Technology(2007)
[5] Luebke,D.、Harris,M.、Govindaraju,N.、Lefohn,A.、Houston,M.,Owens,J.、Segal,M.和Papakipos,M..、Buck,I.:GPGPU:图形硬件上的通用计算。附:2006年ACM/IEEE超级计算会议记录(2006)·doi:10.145/1188455.1188672
[6] Allard,J.、Cotin,S.、Faure,F.、Bensoussan,P.J.、Poyer,F.,Duriez,C.、Delingette,H.、Grisoni,L.:Sofa-医学模拟的开源框架。卫生技术与信息学研究125,13
[7] Lawlor,O.,Chakravorty,S.,Wilmarth,T.,Choudhury,N.,Dooley,I.,Zheng,G.,Kale,L.:ParFUM:用于可扩展动态物理应用的非结构化网格的并行框架。计算机工程22、215–235(2006)·doi:10.1007/s00366-006-0039-5
[8] Becker,C.、Kilian,S.、Turek,S.,Group,F.E.A.S.T.:软件包FEAST的一些概念。收录人:Hernández,V.,Palma,J.M.L.M.,Dongarra,J.(编辑)VECPAR 1998。LNCS,第1573卷,第271-284页。斯普林格,海德堡(1999)·doi:10.1007/1070340_22
[9] van Dyk,D.,Geveler,M.,Mallach,S.,Ribbrock,D.,Gddeke,D.,Gutwenger,C.:HONEI:针对多处理器架构的数值计算库集合。计算机物理通信180(12),2534–2543(2009)·Zbl 1197.65007号 ·doi:10.1016/j.cpc.2009.04.018
[10] Anderson,J.A.、Lorenz,C.D.、Travesset,A.:在图形处理单元上完全实现的通用分子动力学模拟。计算物理杂志227,5342–5359(2008)·Zbl 1148.81301号 ·doi:10.1016/j.jcp.2008.01.047
[11] Kirby,R.C.,Logg,A.:变分形式的编译器。ACM事务处理。数学。柔和。 32, 417–444 ·数字对象标识代码:10.1145/1163641.1163644
[12] Bro-Nielsen,M.:手术模拟中的有限元建模。IEEE 86、283–291会议记录(1998)·数字对象标识代码:10.1109/5.662874
[13] Garcia,E.:信息检索教程(2005),网址:http://www.mislita.com
[14] Teran,J.、Sifakis,E.、Irving,G.、Fedkiw,R.:稳健准静态有限元和肉体模拟。收录:SCA 2005:2005年ACM SIGGRAPH/欧洲制图计算机动画研讨会论文集(2005)·数字对象标识代码:10.1145/1073368.1073394
[15] Kerdok,A.E.、Cotin,S.M.、Ottensmeyer,M.P.、Galea,A.M.、Howe,R.D.、Dawson,S.L.:真理立方体:建立软组织模拟的物理标准。医学图像分析7,283–291(2003)·doi:10.1016/S1361-8415(03)00008-2
[16] de Farias,T.S.M.,Almeida,M.W.S.,Teixeira,J.M.X.,Teichrieb,V.,Kelner,J.:实时变形体物理模拟的高性能大规模并行方法。2008年第20届计算机体系结构与高性能计算国际研讨会。SBAC-PAD 2008,第45-52页(2008年)·doi:10.1109/SBAC-PAD.2008.11
[17] Joselli,M.,Clua,E.,黑山,A.C.,Aura Pagliosa,P.:一种新的物理引擎,在CPU-GPU之间自动分配进程。收录于:Sandbox 2008:2008年ACM SIGGRAPH视频游戏研讨会会议记录,第149-156页(2008)·doi:10.145/1401843.1401871
[18] Coumans,E.:子弹物理图书馆(2009),http://www.bullettphysics.com
[19] OpenCL规范Munshi,A,Khronos OpenCL工作组(2009)
[20] Fedkiw,R.、Stam,J.、Jensen,H.W.:物理BAM,http://physbam.stanford.edu
[21] Melek,Z.,Keyser,J.:基于物理建模的多分辨率交互。摘自:SPM 2005:2005年ACM固体和物理建模研讨会论文集,第187-196页。ACM,纽约(2005)·doi:10.1145/1060244.1060265
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。