×

MPGOS程序包:使用GPU集成大量独立ODE系统期间的挑战和解决方案。 (英语) Zbl 1464.65004号

概述:介绍了使用大规模并行图形处理单元(GPU)体系结构集成大量独立常微分方程(ODE)过程中的挑战和高效求解技术。主要困难之一是通过主机(CPU)和设备(GPU)之间的PCI-E总线将频繁需要的内存事务最小化,例如,在计算Lyapunov指数、绕组数或最大响应图期间。第二个困难是通过利用GPU体系结构的内存层次结构来最小化缓慢的全局内存事务和内存使用。最后,一个好的GPU求解器必须有效地处理ODE系统可能的异步特征;例如,事件检测发生在不同的时间实例上,或处理不同ODE系统所需的时间步长中的数量级差异。程序包MPGOS(用C++和CUDA C软件环境编写)可以通过添加用户定义的函数来轻松解决上述问题,这些函数必须以与系统右侧类似的方式实现;通过定义独立ODE系统所有实例通用的共享参数的可能性;通过用户可编程参数,仅存储轨迹的所需属性;通过一个简单的方法,可以重叠GPU和CPU计算。本文重点对程序包的实现策略进行了详细描述。

理学硕士:

65-04 与数值分析有关的问题的软件、源代码等
65升99 常微分方程的数值方法
65日元10 特定类别建筑的数值算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Boyd,J.P.,Chebyshev和Fourier光谱方法(2001),多佛出版物:纽约多佛出版物,米诺拉·Zbl 0994.65128号
[2] 卡努托,C。;侯赛尼,M.Y。;Quarteroni,A。;Zang,T.A.,光谱方法(2006),斯普林格·弗拉格:柏林斯普林格尔·弗拉格,海德堡·Zbl 1093.76002号
[3] Bonatto,C。;加拉斯,J.A.C。;Ueda,Y.,阻尼驱动Duffing振荡器中混沌相位的相似性和重现性,《物理学评论E》,77,2026217(2008)
[4] Englisch,V。;Lauterborn,W.,双阱Duffing振荡器的规则窗口结构,《物理学评论a》,44,2,916-924(1991)
[5] 吉尔摩,R。;McCallum,J.W.L.,Duffing振子分岔图中的结构,《物理评论》E,51,935-956(1995)
[6] Kao,Y.H.先生。;黄,J.C。;Gou,Y.S.,Duffing振子中危机的持久性,《物理学评论a》,35,12,5228-5232(1987)
[7] Kozłowski,J。;美国帕里茨。;Lauterborn,W.,两个耦合周期驱动Duffing振荡器的分岔分析,Phys Rev E,51,3,1861-1867(1995)
[8] 美国帕里茨。;Lauterborn,W.,Duffing方程分歧集的超结构(ddot{x}+d\dot{x}+x+x^3=f\cos(ωt)),Phys-Lett A,107,8,351-355(1985)
[9] Wang,C.S。;Kao,Y.H。;黄,J.C。;Gou,Y.S.,广义Duffing振子分岔结构的势依赖性,Phys Rev A,45,6,3471-3485(1992)
[10] Knop,W。;Lauterborn,W.,经典莫尔斯振子的分叉结构,化学物理杂志,93,6,3950-3957(1990)
[11] 谢夫奇克,C。;美国帕里茨。;Kurz,T。;Knop,W。;Lauterborn,W.,驱动耗散非线性振荡器分叉结构的比较,Phys Rev A,43,12,6495-6502(1991)
[12] Kurz,T。;Lauterborn,W.,Toda振荡器的分叉结构,《物理学评论A》,371029-1031(1988)
[13] Goswami,B.K.,周期1和周期2分支之间的相互作用以及周期受迫激光速率方程中分岔结构的重现性,Opt Commun,122,4,189-199(1996)
[14] Goswami,B.K.,涉及周期三倍化的分支结构中的自相似性,以及对周期n元组化的建议推广,Phys-Lett a,245,1-2,97-109(1998)
[15] Goswami,B.K.,近似toda振荡器分析中软弹簧和硬弹簧双稳态之间的触发器,Pramana,77,5,987-1005(2011)
[16] Meucci,R。;Salvadori,F。;Naimee,K.A。;布鲁吉奥尼,S。;戈斯瓦米,B.K。;Boccaletti,S.,《调制激光器和洛伦兹电路中的吸引子选择》,Phil Trans R Soc a,366,475-486(2008)·Zbl 1152.78333号
[17] Goswami,B.K.,《控制多状态跳跃间歇》,《物理评论E》,78,066208(2008)
[18] Goswami,B.K.,《多稳态状态下混沌的受控破坏》,《物理学评论E》,76,016219(2007)
[19] Lorenz,E.N.,《确定性非周期流》,《大气科学杂志》,第20、2、130-141页(1963年)·Zbl 1417.37129号
[20] 梅廷,R。;美国帕里茨。;Lauterborn,W.,驱动范德波尔振荡器的分岔结构,国际分岔混沌杂志,03,06,1529-1555(1993)·兹伯利0887.34032
[21] Zhang,Y。;张毅,双频声激励下气泡的混沌振荡,超声声化学,40,151-157(2018)
[22] Zhang,Y。;Zhang,Y。;Li,S.,在双频声激励下液体中振荡的气泡的组合和同时共振,超声声化学,35,431-439(2017)
[23] Zhang,Y。;Zhang,Y。;Li,S.,双频声激励下两个气泡之间的二次冲击力,超声声化学,29,129-145(2016)
[24] Zhang,Y。;Billson,D。;Li,S.,双频声激励的压力振幅和频率对气泡界面间传质的影响,《国际热质传递杂志》,66,16-20(2015)
[25] Zhang,Y。;杜,X。;西安,H。;Wu,Y.,双频声激励下液体中气泡界面的不稳定性,超声声化学,23,16-20(2015)
[26] Yasui,K。;Tuziuti,T.等人。;Lee,J。;Kozuka,T。;托瓦塔,A。;Iida,Y.,《声致发光和声化学反应中活性气泡的环境半径范围》,《化学物理杂志》,128,18,184705(2008)
[27] Yasui,K。;Tuziuti,T。;Kozuka,T。;托瓦塔,A。;Iida,Y.,超声作用下气泡内产生的主要氧化剂与气泡温度之间的关系,化学物理杂志,127,15,154502(2007)
[28] Yasui,K。;Tuziuti,T。;Iida,Y.,氧化剂声化学生产的最佳气泡温度,超声波,42,1,579-584(2004)
[29] 1862-1862
[30] 1888年至1888年
[31] 3493-3493
[32] Sojahrood,A.J。;韦吉拉克(Wegierak,D.)。;哈吉,H。;Karshfian,R。;Kolios,M.C.,《分析声激励气泡振荡器超谐波和超谐波行为的简单方法》,《超声波声化学》,54,99-109(2019)
[33] 3493-3493
[34] Hős,C.J。;Champneys,A.R。;Paul,K。;McNeely,M.,《天然气服务中直接弹簧加载泄压阀的动态行为:II降阶建模》,《J Loss Prevent Proc》,36,1-12(2015)
[35] Hős,C.J。;Champneys,A.R。;Paul,K。;McNeely,M.,《天然气服务中直接弹簧加载泄压阀的动态行为:模型开发、测量和失稳机制》,《J Loss Prevent Proc》,31,70-81(2014)
[36] Hős,C。;Champneys,A.R.,泄压阀模型中的格拉茨分叉和颤振,Physica D,241,222068-2076(2012)
[37] Hős,C。;Champneys,A.R。;Kullmann,L.,系泊出口压缩系统中喘振和旋转失速的分岔分析,IMA J Appl Math,68,2,205-228(2003)·Zbl 1072.76065号
[38] Altintas,Y。;Stepan,G。;Merdol,D。;Dombovari,Z.,频率和离散时域中铣削的颤振稳定性,CIRP J Manuf Sci-Tech,1,1,35-44(2008)
[39] Molnar,T.G。;佐治亚州东博瓦里。;督察官,T。;Stepan,G.,通过半离散化对非线性时间周期时滞系统的分岔分析,国际数值方法工程杂志,115,1,57-74(2018)
[40] Kiss,A.K。;Avediov,S.S。;巴赫拉蒂,D。;Orosz,G.,《互联车辆系统的全球动力学》,非线性动力学,96,3,1865-1877(2019)·Zbl 1437.70046号
[41] 里纳尔迪,S。;兰迪,P。;Rossa,F.D.,《暂时的虚张声势在社会系统中是有回报的:浪漫关系的案例》,《数学社会学杂志》,39,3,203-220(2015)·兹比尔1331.91152
[42] Rey,J.-M.,解释婚姻破裂的情感动力学的数学模型,PLoS ONE,5,3,1-8(2010)
[43] 兰迪,P。;Dercole,F.,《时尚的社会多元化》,《数学社会学杂志》,40,3,185-205(2016)·Zbl 1417.91099号
[44] 费雷尔,E。;Helm,J.L.,二元相互作用中生理协同调节的动力学系统建模,《国际心理生理学杂志》,88,3,296-308(2013)
[45] 安德列夫,A.V。;Pisarick,A.N.,《hodgkin-Huxley生物神经元网络中相干共振现象的数学模拟》(Postnov,D.E.,Saratov Fall Meeting2018:计算和数据分析:从纳米工具到大脑功能,11067(2019),国际光学与光子学学会;SPIE),第36-41页
[46] 安德列夫,A.V。;新南威尔士州弗罗洛夫。;Pisarick,A.N。;Hramov,A.E.,双稳态hodgkin-Huxley神经元复杂网络中的Chimera状态,Phys Rev E,100,2022224(2019)
[47] Maksimenko,V.A。;马卡洛夫,V.V。;贝拉,B.K。;Ghosh,D。;达纳,S.K。;Goremyko,M.V.,《通过多路复用激发和抑制嵌合体状态》,《物理学评论E》,94,5,052205(2016)
[48] 齐默尔曼,R.S。;Parlitz,U.,《利用水库计算观测可激发介质的时空动力学》,《混沌》,28,4,043118(2018)
[49] Schlemmer,A。;Berg,S。;Lilienkamp,T。;路德,S。;Parlitz,U.,时空排列熵作为心律失常复杂性的度量,Front Phys,6,39(2018)
[50] Bittihn,P。;伯格,S。;美国帕里茨。;Luther,S.,异质可激发介质中时空混沌的突发动力学,混沌,27,9,093931(2017)
[51] Chandrasekar,V.K。;Gopal,R。;文凯特桑,A。;Lakshmanan,M.,《全局耦合振荡器中强度诱导嵌合体状态的机制》,《物理评论E》,90,6,062913(2014)
[52] Glaze,T.A。;刘易斯,S。;Bahar,S.,Chimera在热敏神经元的hodgkin-Huxley模型中表示,混沌,26,8,083119(2016)
[53] Yeldesbay,A。;Pikovsky,A。;Rosenblum,M.,《全球耦合振荡器系综中的类奇美拉态》,Phys Rev Lett,112,14,144103(2014)
[54] 达科斯塔,D.R。;Hansen,M。;Guarise,G。;Medrano-T,共和党人。;Leonel,E.D.,《极端轨道在一维地图参数空间周期区域全球组织中的作用》,Phys-Lett A,380,18,1610-1614(2016)
[55] de Souza,S.L.T.公司。;利马,A.A。;Caldas,I.L。;Medrano-T,R.O。;Guimara̋es-Filho,Z.O.,双基因系统离散模型周期结构的自相似性,Phys-Lett a,376,15,1290-1294(2012)·Zbl 1260.37060号
[56] Medeiros,E.S。;Medrano-T,R.O。;Caldas,I.L。;de Souza,S.L.T.,周期窗口序列的扭转加和渐近缠绕数,Phys Lett A,377,8,628-631(2013)·Zbl 1428.37061号
[57] Medeiros,E.S。;de Souza,S.L.T.公司。;Medrano-T,R.O。;Caldas,I.L.,复制受驱动振荡器参数空间中的周期窗口,混沌孤子分形,44,11,982-989(2011)
[58] 梅代罗斯,E.S。;de Souza,S.L.T.公司。;Medrano-T,R.O。;Caldas,I.L.,冲击振荡器参数空间中出现的周期窗口,Phys-Lett A,374,26,2628-2635(2010)·Zbl 1237.37029号
[59] Medrano-T,R.O。;Rocha,R.,蔡氏电路参数空间的反面:稳定性分析、周期加成、吸引域变质和实验研究,国际分叉混沌杂志,24,09,1430025(2014)·Zbl 1301.34067号
[60] de Oliveira,法学硕士。;蒙特罗,L.T。;达科斯塔,D.R。;Méndez-Bermüdez,J.A。;Medrano-T,R.O。;Leonel,E.D.,耗散映射族参数空间的研究,混沌,29,5,053114(2019)
[61] 塞莱斯蒂诺,A。;Manchein,C。;阿尔伯克基,H.A。;Beims,M.W.,《参数空间中的稳定结构与最佳棘轮传输》,《公共非线性科学数值模拟》,第19、1、139-149页(2014年)
[62] A.C.C.霍斯特曼。;阿尔伯克基,H.A。;Manchein,C.,耗散相对论标准映射参数空间中温度对一般稳定周期结构的影响,《欧洲物理杂志》B,90,5,96(2017)
[63] 尼科洛,N.S。;Oliveira,T.M。;霍夫,A。;阿尔伯克基,H.A。;Manchein,C.,《蔡氏电路模型参数空间中的多稳态跟踪》,《欧洲物理杂志》B,92,5,106(2019)
[64] 马可迪斯,D.W.C。;科马塞托,G.F。;佩德罗,B.G。;J.C.C.维埃拉。;霍夫,A。;Prebianca,F.,《瓦特调速器模型的广泛数值研究和电路实现》,国际分叉混沌杂志,27,11,1750175(2017)
[65] 塞莱斯蒂诺,A。;Manchein,C。;阿尔伯克基,H.A。;Beims,M.W.,《参数空间中的棘轮传输和周期结构》,《物理学评论》,第106、23、234101页(2011年)
[66] Jousseph,C.A.C。;阿卜杜拉克,S.A。;Manchein,C。;Beims,M.W.,《通过耗散实现规则岛屿的等级崩塌》,《物理学报》,第51期,第10期,第105101页(2018年)·兹比尔1386.37058
[67] Jousseph,C.A。;Kruger,T.S。;Manchein,C。;Lopes,S.R。;Beims,M.W.,吸引力盆地边缘轨迹的弱耗散效应,《物理学A》,45668-74(2016)·Zbl 1400.37050号
[68] Heged By s,F。;劳特伯恩,W。;美国帕里茨。;Mettin,R.,通过双频驱动直接控制非线性振荡器中多稳态的非反馈技术,非线性Dyn,94,1273-293(2018)
[69] Heged By s,F。;Klapcsik,K。;劳特伯恩,W。;美国帕里茨。;Mettin,R.,GPU《六维参数空间中双频驱动单个气泡的加速研究:主动空化阈值》,《超声波声化学》,67,105067(2020)
[70] 斯通,C.P。;Alferman,A.T。;Niemeyer,K.E.,《用协处理器加速有限速率化学动力学:比较GPU、MIC和CPU上的矢量化方法》,《计算物理通讯》,226,18-29(2018)
[71] 新泽西州柯蒂斯。;Niemeyer,K.E。;Sung,C.J.,基于GPU的刚性化学动力学集成方法研究,Combust Flame,179,312-324(2017)
[72] Niemeyer,K.E。;Sung,C.-J.,在计算流体动力学中开发图形处理器的最新进展和挑战,超级计算机杂志,67,2,528-564(2014)
[73] 德克萨斯州葡萄藤(达拉斯/沃思堡地区)
[74] 下水道,F。;Rigopoulos,S.,GPU刚性化学动力学集成方法,Combust Flame,162,4,1375-1394(2015)
[75] 盖斯特,K。;美国帕里茨。;Lauterborn,W.,计算lyapunov指数的不同方法的比较,Prog-Teor Phys,83,5,875-893(1990)·Zbl 1058.65512号
[76] Parlitz,U.,从时间序列中识别真实和虚假的lyapunov指数,国际分叉混沌杂志,02,01,155-165(1992)·Zbl 0878.34047号
[77] Skokos,C.,《Lyapunov特征指数及其计算》,63-135(2010),斯普林格-柏林-海德堡:斯普林格
[78] Englisch,V。;美国帕里茨。;Lauterborn,W.,对称和非对称振荡系统的缠绕数序列比较,《物理评论E》,92,2,022907(2015)
[79] Englisch,V。;Lauterborn,W.,由法雷分馏导出的周期双重级联的卷积数极限,国际分叉混沌杂志,4,4,999-1002(1994)·Zbl 0874.34034号
[80] 美国帕里茨。;Lauterborn,W.,《驱动范德波尔振荡器的周期双级联和魔鬼楼梯》,《物理学评论A》,36,3,1428-1434(1987)
[81] 美国帕里茨。;Lauterborn,W.,驱动耗散非线性振子的共振和扭转数,Z Naturforsch A,41,4,605-614(1986)
[82] 电子153459.98975
[83] Rackauckas,C。;Nie,Q.,differential equations.jl-用于求解julia微分方程的性能丰富的生态系统,J Open Res Softw,5,1,15(2017)
[84] Soyata,T.,《使用CUDA进行GPU并行程序开发》(2018),CRC出版社:佛罗里达州博卡拉顿CRC出版社
[85] 柯克,D.B。;Hwu,W.-m.W.,《大规模并行处理器编程》(2017),爱思唯尔公司:爱思唯尔公司,美国剑桥
[86] Cheng,J。;格罗斯曼,M。;McKercher,T.,专业CUDA c编程(2014),John Wiley&Sons,Inc.:John Wiley&Sons,Inc.,印第安纳州印第安纳波利斯
[87] Hegedüs F.MPGOS:用于大量独立常微分方程系统的GPU加速积分器。匈牙利布达佩斯科技经济大学;2019
[88] Nagy D.、Plavecz L.、Hegedüs F.在GPU和CPU上求解大量非刚性低维常微分方程组:MPGOS、ODEINT和微分方程的性能比较.jl;2020年提交。
[89] 网址:www.gpodae.com。
[90] Ahnert,K。;Demidov,D。;Mulansky,M.,在GPU上求解常微分方程,125-157(2014),Springer International Publishing·Zbl 1317.65155号
[91] http://headeryshoulder.github.io/odeint-v2/。
[92] 梅廷,R。;Cairós,C。;Troia,A.,《声化学与气泡动力学》,超声声化学,25,24-30(2015)
[93] 劳特伯恩,W。;Kurz,T.,《气泡振荡的物理》,《物理学报》,第73期,第10期,第106501页(2010年)
[94] Tatake,P.A。;潘迪特,A.B.,《腔动力学和空化产率的建模和实验研究:双频超声源的影响》,化学工程科学,57,22,4987-4995(2002)
[95] Heged By s,F。;Klapcsik,K.,《高粘度对谐波激励气泡崩塌状混沌和规则周期振荡的影响》,《超声波声波化学》,27,153-164(2015)
[96] 克拉普西克,K。;Hegedʘs,F.,粘性液体中声波辐照下非球形气泡振荡的研究,超声声化学,54,256-273(2019)
[97] Murray,L.,《龙格库塔积分器的GPU加速》,IEEE T Parall District,23,1,94-101(2012)
[98] Demidov,D。;Ahnert,K。;鲁普,K。;Gottschling,P.,《CUDA和opencl编程:使用现代c++库的案例研究》,SIAM科学计算杂志,35,5,C453-C472(2013)·Zbl 1311.65179号
[99] Shi,Y。;格林,W.H。;黄,H.-W。;Oluwole,O.O.,《使用GPU和混合显式/隐式ODE集成加速多维燃烧模拟》,Combust Flame,159,7,2388-2397(2012)
[100] Le,H.P。;坎比尔,J.-L。;Cole,L.K.,基于GPU的流动模拟与详细化学动力学,计算物理通讯,184,3,596-606(2013)
[101] Al-Omari,A。;阿诺德·J。;塔哈,T。;Schüttler,H.B.,使用多个GPGPU和自适应龙格库塔ODE解算器求解具有层次结构的一阶常微分方程的大型非线性系统,IEEE Access,1770-777(2013)
[102] 布罗克,B。;皮带,A。;Billings,J.J。;Guidry,M.,《针对大型动力学网络的GPU加速显式集成》,《计算物理杂志》,302,591-602(2015)·Zbl 1349.85002号
[103] 法扎纳罗,F.I。;哥伦比亚特区索里亚诺。;Suyama,R。;M.K.马德里。;奥利维拉,J.R。;Muñoz,I.B.,《使用并行计算对非线性动力系统进行数值表征:GPU方法的作用》,《公共非线性科学数值模拟》,37,143-162(2016)·Zbl 1473.37102号
[104] 艾姆伦,A。;Haworth,D.C.,《关于基于外推法的燃烧CFD刚性常微分方程解算器的优点》,Combust Flame,174,1-15(2016)
[105] 科瓦克,T。;哈伯,T。;Reeth,F.V。;Hens,N.,《流行病学模型拟合和模拟的异质计算》,BMC Bioninform,19,1,101(2018)
[106] 诺比尔,S.M。;卡扎尼加,P。;贝索齐,D。;Mauri,G.,Ginsoad:GPU上刚性ODE系统的大规模并行集成,J Supercomput,75,12,1-12(2018)
[107] 辛德马什,A.C。;Brown,P.N。;格兰特,K.E。;Lee,S.L。;塞尔维亚共和国。;Shumaker,D.E.,SUNDIALS:非线性和微分/代数方程求解器套件,ACM Trans Math Softw,31,3,363-396(2005)·Zbl 1136.65329号
[108] https://computing.llnl.gov/projects/sundials。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。