×

基于八叉树的GPU实现的连续细胞自动机,用于模拟复杂的演化曲面。 (英语) Zbl 1217.65040号

摘要:目前,基于动态曲面的模型需要包含越来越多的点,并在更长的时间段内传播这些点。对于大量曲面点,八叉树数据结构可以在低内存占用和相对快速地访问存储数据之间取得平衡。对于依赖于邻域状态的演化规则,可以通过使用简化的原子传播模型(如细胞自动机(CA))获得延长的模拟周期。然而,这种方法具有内在的并行更新特性,当在设计用于任务顺序执行的经典中央处理器(CPU)上执行时,相应的模拟效率很低。
在本文中,提出了一系列指南,用于将基于八叉树的复杂演化曲面的CA模拟有效地适配为大规模并行计算硬件。图形处理单元(GPU)被用作并行体系结构的成本效益示例。对于实际模拟,我们认为硅各向异性湿化学蚀刻期间的表面传播是一个具有计算挑战性的过程,在微工程应用中有广泛的应用。时间演化采用本质上并行的连续CA模型。我们的研究强烈表明,使用CA方法模拟的动态演化曲面的并行计算因采用八叉树作为支持数据结构而大大受益,大大减少了总体计算时间和内存使用。

MSC公司:

65D17号 计算机辅助设计(曲线和曲面建模)
第65年 并行数值计算
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Yee,K.,IEEE传输。天线与传播,14302(1966)·Zbl 1155.78304号
[2] Anderson,J.D.,《计算流体动力学:应用基础》(1995),McGraw-Hill·Zbl 0922.76003号
[3] Suntola,T.,晶体生长手册3,薄膜和外延,B部分:生长机制和动力学(1994年),爱思唯尔科学出版社,(第14章)
[4] Puurunen,R.L.,J.应用。物理。,97, 121 (2005)
[5] 风,R.A。;海恩斯,理学硕士,冲浪科学。,460, 21 (2000)
[6] 哈伯德·T·J。;Antonsson,E.,传感器材料。,9, 437 (1997)
[7] Zhou,Z。;黄,Q。;李伟(Li,W.)。;朱,C.,J.Phys。Conf.序列号。,34, 674 (2006)
[8] Halfhill,T.R.,微处理器报告通讯,(2009年12月14日访问)
[9] J·欧文斯。;马萨诸塞州休斯顿。;Luebke,D。;格林,S。;斯通,J。;菲利普斯,J.,Proc。IEEE,96,879(2008)
[10] Libes,D.,计算。图表。Mag.,15383(1991)
[11] Gosálvez,文学硕士。;Xing,Y。;佐藤,K。;Nieminen,R.M.,J.微型机械。美工。,18, 055029 (2008)
[12] 应变,J.,J.计算。物理。,151, 616 (1999) ·Zbl 0942.76061号
[13] Losasso,F。;Gibou,F。;Fedkiw,R.,ACM事务。图表。,23, 457 (2004)
[14] Xing,Y。;Gosálvez,文学硕士。;佐藤,K.,《新物理学杂志》。,9436(2007年)
[15] Gosálvez,文学硕士。;Xing,Y。;Sato,K.,J.微电子机械。系统。,17, 410 (2008)
[16] Gosálvez,文学硕士。;Xing,Y。;佐藤,K。;Nieminen,R.M.,传感器。执行器。A、 155、98(2009年)
[17] Gobron,S。;Devillard,F。;海特·B·马赫。愿景应用。,18, 331 (2007)
[18] 肖尔,D。;Steckel,J.A.(2009),《威利-国际科学》
[19] Gosálvez,文学硕士。;佐藤,K。;福斯特,A.S。;Nieminen,R.M。;Tanaka,H.,J.微型机械。美工。,17,S1(2007)
[20] Merveille,C.,传感器。执行器。A、 60、244(1997)
[21] 邱,L。;海因,S。;Obermeier,E。;舒伯特,A.,《传感器》。执行器。A、 54、547(1996)
[22] J.D.Martinez、P.Blondy、A.Pothier、D.Bouyge、A.Crunteanu、M.Chatras,摘自:《欧洲微波会议》,2007年,第439页。;J.D.Martinez、P.Blondy、A.Pothier、D.Bouyge、A.Crunteanu、M.Chatras,摘自:《欧洲微波会议》,2007年,第439页。
[23] 英伟达CUDA
[24] S.Ryoo、C.L.Rodrigues、S.S.Baghsorki、S.S.Stone、D.B.Kirk、W.W.Hwu,摘自:Proc。PPoPP,2008年,第73页。;S.Ryoo、C.L.Rodrigues、S.S.Baghsorki、S.S.Stone、D.B.Kirk、W.W.Hwu,摘自:Proc。PPoPP,2008年,第73页。
[25] VisualTAPAS模拟器
[26] SIMODE示例集(c)2001,gesselschaft fur mikroelektronikanwendung chemnitz mbh。;SIMODE示例集(c)2001,gesselschaft fur mikroelektronikanwendung chemnitz mbh。
[27] Schröpfer,G。;de Labachelerie,M。;Ballandras,S。;Blind,P.,J.微型机械。美工。,8, 77 (1998)
[28] Cates,J.E。;Lefohn,A.E。;惠特克,R.T.,Med.Im。分析。,8, 217 (2004)
[29] Sypek,P。;Dziekonski,A。;Mrozowski,M.,IEEE传输。《磁学》,45,1324(2009)
[30] Komatitsch,D。;Michéa,D。;Erlebacher,G.,J.平行距离补偿。,69, 451 (2009)
[31] Szakaly,F.M.T。;梅萨罗斯,R。;拉齐,I.,计算机。物理学。Comm.,181,105(2009)
[32] 马丁森,P。;布拉斯科,J。;Künnemeyer,R。;Jordan,R.,计算。物理学。Comm.,1791983(2009)
[33] 刘伟。;施密特,B。;沃斯,G。;缪勒·维蒂格,W.,《计算》。物理学。Comm.,179,634(2008)
[34] Lefohn,A.E。;Kniss,J.M。;Hansen,C.D。;惠特克,R.T.,IEEE Trans。视觉。计算。图表。,10, 422 (2004)
[35] Jeong,W.K。;拜耳,J。;Hadwiger,M。;A.巴斯克斯。;普菲斯特,H。;惠特克,R.T.,IEEE Trans。视觉。计算。图表。,15, 1505 (2009)
[36] M.Roberts,M.C.Sousa,J.R.Mitchell,在:Proc。《高性能图形》,2010年,第123页。;M.Roberts、M.C.Sousa、J.R.Mitchell,摘自:Proc。《高性能图形》,2010年,第123页。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。