×

兹马思-数学第一资源

程序包MPGOS:使用gpu集成大量独立ODE系统的挑战和解决方案。(英语) Zbl 1464.65004号
摘要:介绍了图形处理单元(gpu)的大规模并行体系结构在集成大量独立常微分方程(ODEs)时所面临的挑战和有效的求解技术。其中一个主要的困难是通过PCI-E总线将主机(CPU)和设备(GPU)之间的内存事务最小化,例如在计算Lyapunov指数、绕组数或最大响应图时。第二个困难是通过利用GPU体系结构的内存层次结构将缓慢的全局内存事务和内存使用最小化。最后,一个好的GPU解算器必须有效地处理ODE系统可能存在的异步特性;例如,事件检测发生在不同的时间实例中,或者处理不同ODE系统所需时间步数的数量级差异。程序包MPGOS(用C++和cudac软件环境编写)可以通过添加用户定义的函数来轻松解决上述问题,这些函数必须类似于系统的右侧实现;通过定义所有独立ODE系统实例的共享参数的可能性;通过用户可编程参数,仅存储所需的轨迹特性;通过一个简单的是重叠GPU和CPU计算。本文重点对程序包的实现策略进行了详细的描述。
理学硕士:
65-04年 与数值分析有关的问题的软件、源代码等
65L99型 常微分方程的数值方法
65日元 特定建筑类的数值算法
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] Boyd,J.P.,Chebyshev和Fourier光谱方法(2001),多佛出版物:多佛出版物,纽约,米内奥拉·Zbl 0994.65128
[2] 卡努托,C。;胡赛尼,M.Y。;夸托尼,A。;Zang,T.A.,光谱方法(2006),Springer Verlag:Springer Verlag Berlin,海德堡·Zbl 1093.76002号
[3] 博纳托,C。;加拉斯,J.A.C。;《阻尼驱动Duffing振子中混沌相位的相似性和重现性》,Phys Rev E,77,2,026217(2008)
[4] 英语,V。;劳特伯恩,W.,《双阱Duffing振子的规则窗口结构》,Phys Rev a,44,2916-924(1991)
[5] 吉尔摩,R。;麦卡伦,J.W.L.,杜芬振子分岔图中的结构,物理版E,51935-956(1995)
[6] 高永华。;黄建中。;郭玉玺,杜芬振子中危机的持续性,物理评论a,35,12,5228-5232(1987)
[7] Kozłowski,J。;帕利茨,美国。;劳特伯恩,W.,《两个耦合周期驱动杜芬振子的分岔分析》,Phys Rev E,51,3,1861-1867(1995)
[8] 帕利茨,美国。;Lauterborn,W.,Duffing方程分歧集中的上层结构\(\ddot{x}+d\dot{x}+x+x^3=f\cos(\omega t)),Phys Lett A,107,8,351-355(1985)
[9] Wang,C.S。;高永华。;黄建中。;郭玉玺.广义Duffing振子中分叉结构的势依赖性.物理学报A版,45,63471-3485(1992)
[10] 诺普,W。;劳特伯恩,W.,《经典莫尔斯振子的分叉结构》,化学物理杂志,93,6,3950-3957(1990)
[11] Scheffczyk,C。;帕利茨,美国。;库兹,T。;诺普,W。;劳特伯恩,W.,《驱动耗散非线性振子分叉结构的比较》,Phys Rev A,43,12,6495-6502(1991)
[12] 库兹,T。;劳特伯恩,W.,《托达振荡器的分叉结构》,《物理学》A版,371029-1031(1988)
[13] Goswami,B.K.,周期1和周期2分支之间的相互作用和周期强迫激光速率方程中分叉结构的重现,Opt Commun,122,4,189-199(1996)
[14] Goswami,B.K.,分岔结构中涉及周期三倍的自相似性,以及对周期n元组的推广,Phys Lett a,245,1-2,97-109(1998)
[15] Goswami,B.K.,《近似toda振荡器分析中软弹簧和硬弹簧双稳态之间的触发器》,Pramana,77,5987-1005(2011)
[16] 美乌奇,R。;萨尔瓦多,F。;奈米,K.A。;布鲁乔尼,S。;哥斯瓦米,英国。;Boccaletti,S.,调制激光器和洛伦兹电路中的吸引子选择,Phil Trans R Soc a,366,475-486(2008)·Zbl 1152.78333
[17] Goswami,B.K.,多状态跳跃间歇控制,Phys Rev E,78066208(2008)
[18] Goswami,B.K.,多稳态状态下混沌的受控破坏,Phys Rev E,76016219(2007)
[19] 洛伦兹,E.N.,确定性非周期流,大气科学杂志,20,2,130-141(1963)·Zbl 1417.37129号
[20] 梅丁,R。;帕利茨,美国。;劳特伯恩,W.,《驱动范德波尔振子的分岔结构》,国际分岔混沌杂志,03,06,1529-1555(1993)·Zbl 0887.34032
[21] 张,Y。;Zhang,Y.,《双频声激励下气泡的混沌振荡》,UltrasonSonochem,40151-157(2018)
[22] 张,Y。;张,Y。;Li,S.,在双频声激励下液体中振荡气泡的组合和同时共振,超声声化学,35431-439(2017)
[23] 张,Y。;张,Y。;Li,S.,双频声激励下两个气泡间的二次bjerknes力,Ultrason Sonochem,29129-145(2016)
[24] 张,Y。;比尔森,D。;气泡质量传递的双重频率、频率和频率的影响
[25] 张,Y。;杜,X。;西安,H。;Wu,Y.,双频声激励下液体中气泡界面的不稳定性,超声声化学,23,16-20(2015)
[26] 雅水,K。;图齐乌提,T。;李,J。;科祖卡,T。;托瓦塔,A。;Iida,Y.,声致发光和声化学反应中活性气泡的环境半径范围,化学物理杂志,128,18,184705(2008)
[27] 雅水,K。;图齐乌提,T。;科祖卡,T。;托瓦塔,A。;Iida,Y.,超声波作用下气泡温度与气泡内产生的主要氧化剂之间的关系,化学物理杂志,127,15,154502(2007)
[28] 雅水,K。;图齐乌提,T。;Iida,Y.,氧化剂声化学生产的最佳气泡温度,超声学,42,1579-584(2004)
[29] 1862-1862年
[30] 1888-1888年
[31] 3493-3493
[32] 索贾鲁德,A.J。;韦吉拉克,D。;哈吉,H。;卡尔什芬,R。;Kolios,M.C.,《分析声激励气泡振荡器的超谐波和超谐波行为的简单方法》,Ultrason Sonochem,54,99-109(2019年)
[33] 3493-3493
[34] Hős,C.J。;Champneys,A.R。;保罗K。;McNeely,M.,天然气服务中直接弹簧加载泄压阀的动态行为:II降阶模型,J损失预防程序,36,1-12(2015)
[35] Hős,C.J。;Champneys,A.R。;保罗K。;McNeely,M.,天然气服务中直接弹簧加载泄压阀的动态行为:模型开发、测量和不稳定性机制,J Loss Prevent Proc,31,70-81(2014)
[36] Hős,C。;Champneys,A.R.,《卸压阀模型中的放牧分岔和颤振》,Physica D,241,22,2068-2076(2012)
[37] Hős,C。;Champneys,A.R。;库尔曼,L.,《摩尔格雷茨压缩系统中喘振和旋转失速的分岔分析》,应用数学杂志,68,2205-228(2003)·Zbl 1072.76065号
[38] 高度,Y。;斯特潘,G。;梅多尔,D。;Dombovari,Z.,铣削颤振在频率和离散时间域的稳定性,CIRP J Manuf Science,1,1,35-44(2008)
[39] 莫尔纳,T.G。;多姆博瓦里,Z。;Insperger,T。;Stepan,G.,《基于半离散化的非线性周期时滞系统的分岔分析》,Int J Numer Meth Eng,115,1,57-74(2018)
[40] 吻,好吧。;阿维迪索公司。;学士学位。;Orosz,G.,《互联车辆系统的全球动力学》,非线性Dyn,96,3,1865-1877(2019年)·Zbl 1437.70046号
[41] 里纳尔迪S。;兰迪,P。;Rossa,F.D.,《社会系统中暂时的虚张声势是有回报的:浪漫关系的案例》,数学社会学杂志,39,3,203-220(2015)·Zbl 1331.91152号
[42] Rey,J.-M.,《婚姻破裂的情感动力学数学模型》,公共科学图书馆,第1期,第5期,第3期,第1-8期(2010年)
[43] 兰迪,P。;Dercole,F.,《时尚的社会多样化》,数学社会学杂志,40,3,185-205(2016)·Zbl 1417.91099号
[44] 费雷尔E。;Helm,J.L.,二元相互作用中生理协同调节的动力学系统建模,国际心理生理学杂志,88,3,296-308(2013)
[45] 安德列夫,A.V。;Pisarcik,A.N.,霍奇金-赫胥黎生物神经元网络中相干共振现象的数学模拟,(Postnov,D.E.,Saratov Fall Meeting 2018:计算和数据分析:从纳米尺度工具到大脑功能,11067(2019),国际光学与光子学学会;SPIE),36-41
[46] 安德列夫,A.V。;弗罗洛夫,新南威尔士州。;皮萨奇,A.N。;Hramov,A.E.,双稳态霍奇金-赫胥黎神经元复杂网络中的嵌合体状态,Phys Rev E,100,2022224(2019年)
[47] 马克西门科,弗吉尼亚州。;马卡罗夫,V.V。;贝拉,B.K。;戈什,D。;达纳,S.K。;Emyko第5版,第5版,第5版,第5版,第5版,第5版,第5版,第5版,第5版,第5版,第5版,第5版,第5版,第5版,第5版
[48] 齐默尔曼,R.S。;Parlitz,U.,使用储层计算观察可激发介质的时空动力学,混沌,28,4,043118(2018)
[49] 施莱默,A。;贝格,S。;李连坎普,T。;路德S。;Parlitz,U.,《时空排列熵作为心律失常复杂性的衡量标准》,Front Phys,6,39(2018)
[50] 比提恩,P。;贝格,S。;帕利茨,美国。;Luther,S.,异质可激发介质中时空混沌的涌现动力学,混沌,27,9,093931(2017)
[51] 钱德拉塞卡,V.K。;戈帕尔,R。;文卡泰桑,A。;Lakshmanan,M.,全球耦合振荡器中强度诱导嵌合体状态的机制,Phys Rev E,90,6,062913(2014)
[52] 釉,T.A。;刘易斯S。;Bahar,S.,Chimera在霍奇金-赫胥黎热敏感神经元模型中的状态,混沌,26,8,083119(2016)
[53] 耶尔德斯贝,A。;皮科夫斯基,A。;Rosenblum,M.,Chimeralike states in a Englobal coupled振荡器,Phys Rev Lett,112,14,144103(2014年)
[54] 达科斯塔特区。;汉森,M。;瓜里斯,G。;Medrano-T,R.O。;Leonel,E.D.,一维地图参数空间中周期区域全球组织中极端轨道的作用,Phys Lett A,380,18,1610-1614(2016)
[55] 德索扎,S.L.T。;利马,A.A.A。;加州理工学院。;Medrano-T,R.O。;Guimara̋es Filho,Z.O.,双基因系统离散模型周期结构的自相似性,Phys Lett a,376,15,1290-1294(2012)·Zbl 1260.37060
[56] 梅德罗斯,E.S。;Medrano-T,R.O。;加州理工学院。;de Souza,S.L.T.,周期窗口序列的扭加法和渐近卷曲数,Phys Lett A,377,8628-631(2013)·Zbl 1428.37061
[57] 梅德罗斯,E.S。;德索扎,S.L.T。;Medrano-T,R.O。;Caldas,I.L.,在驱动振荡器的参数空间中复制周期窗口,混沌孤子分形,44,11,982-989(2011)
[58] 梅德罗斯,E.S。;德索扎,S.L.T。;Medrano-T,R.O。;Caldas,I.L.,冲击振荡器参数空间中的周期窗口,Phys Lett A,374,26,2628-2635(2010)·Zbl 1237.37029
[59] Medrano-T,R.O。;Rocha,R.,《蔡氏电路参数空间的负边:稳定性分析、周期加法、吸引变形盆地和实验研究》,Int J分叉混沌,24,09,1430025(2014)·Zbl 1301.34067
[60] 德奥利维拉,J.A。;蒙特罗,L.T。;达科斯塔特区。;Méndez Bermúdez,J.A。;Medrano-T,R.O。;Leonel,E.D.,耗散映射族参数空间的研究,混沌,29,5053114(2019)
[61] 塞莱斯蒂诺,A。;曼彻斯特C。;阿尔伯克基,H.A。;Beims,M.W.,参数空间中的稳定结构和最优棘轮传输,Common非线性Sci Numer Simul,19,11939-149(2014)
[62] 霍斯特曼,公元前。;阿尔伯克基,H.A。;Manchein,C.,耗散相对论标准图参数空间中温度对一般稳定周期结构的影响,欧洲物理学报,90,5,96(2017)
[63] 新南威尔士州尼古拉。;奥利维拉,T.M。;霍夫,A。;阿尔伯克基,H.A。;Manchein,C.,蔡氏电路模型参数空间中的多稳态跟踪,欧洲物理杂志B,92,5,106(2019)
[64] 华盛顿特区马孔德斯。;科马塞托,G.F。;佩德罗,B.G。;维埃拉,J.C.C。;霍夫,A。;2017年,比安瓦特(Bian01)第27期《数字电路》和《比安瓦特分岔模型》2017年第11期和第17期《分岔模型》的实施
〔65〕 塞莱斯蒂诺,A。;曼彻斯特C。;阿尔伯克基,H.A。;Beims,M.W.,参数空间中的棘轮传输和周期结构,Phys Rev Lett,106,23,234101(2011)
[66] 约瑟夫,C.A.C。;Abdulack,S.A。;曼彻斯特C。;Beims,M.W.,《通过耗散对规则岛屿的等级崩溃》,Phys A,51,10,105101(2018年)·Zbl 1386.37058
[67] 乔瑟夫,C.A。;克鲁格,T.S。;曼彻斯特C。;洛佩斯,S.R。;Beims,M.W.,吸引盆地边缘轨迹的弱耗散效应,Physica A,45668-74(2016)·Zbl 1400.37050
[68] 黑格德űs,F。;劳特伯恩,W。;帕利茨,美国。;Mettin,R.,通过双频驱动直接控制非线性振荡器中的多稳态的非反馈技术,非线性Dyn,94,1273-293(2018)
〔69〕 黑格德űs,F。;克拉普西克。;劳特伯恩,W。;帕利茨,美国。;Mettin,R.,《6维参数空间中双频驱动单泡的GPU加速研究:主动空化阈值》,UltrasonSonochem,67105067(2020)
[70] 斯通公司。;阿尔弗曼,A.T。;Niemeyer,K.E.,用协处理器加速有限速率化学动力学:比较GPU、MIC和CPU上的矢量化方法,Comput Phys Commun,226,18-29(2018)
[71] 新泽西州柯蒂斯。;尼迈耶,K.E。;Sung,C.J.,基于GPU的刚性化学动力学积分方法的研究,燃烧火焰,179312-324(2017)
[72] 尼迈耶,K.E。;Sung,C.-J.,在计算流体力学中开发图形处理器的最新进展和挑战,超级计算机杂志,67,2528-564(2014)
[73] 德克萨斯州葡萄藤(达拉斯/沃斯堡地区)
[74] 下水道,F。;Rigopoulos,S.,《GPU上刚性化学动力学整合方法论》,燃烧火焰,162,4,1375-1394(2015)
[75] 盖斯特,K。;帕利茨,美国。;劳特伯恩,W.,《计算李雅普诺夫指数的不同方法的比较》,进步物理学,83,5875-893(1990)·Zbl 1058.65512
[76] Parlitz,U.,从时间序列中识别真和假lyapunov指数,Int J分叉混沌,02,01,155-165(1992)·Zbl 0878.34047
[77] Skokos,C.,Lyapunov特征指数及其计算,63-135(2010),斯普林格-柏林-海德堡:斯普林格-柏林-海德堡-柏林,海德堡
[78] 英语,V。;帕利茨,美国。;Lauterborn,W.,对称和非对称振荡系统的绕组编号序列比较,Phys Rev E,92,22022907(2015)
[79] 英语,V。;劳特伯恩,W.,《由费里分数导出的倍周期级联的绕组数极限》,Int J分叉混沌,4,4,999-1002(1994)·Zbl 0874.34034
[80] 帕利茨,美国。;Lauterborn,W.,《驱动范德波尔振荡器的倍周期级联和魔鬼阶梯》,Phys Rev A,36,3,1428-1434(1987)
[81] 帕利茨,美国。;劳特伯恩,W.,《驱动耗散非线性振子的共振和扭转数》,Z Naturforsch A,41,4,605-614(1986)
[82] 邮编:e153459.98975
[83] 拉克考克斯,C。;Nie,Q.,differential equations.jl-用于求解微分方程的性能和功能丰富的生态系统,julia,J Open Res Softw,5,1,15(2017年)
[84] Soyata,T.,使用CUDA开发GPU并行程序(2018),CRC出版社:CRC出版社,佛罗里达州博卡拉顿
[85] 柯克,哥伦比亚特区。;华盛顿大学。W、 《大规模并行处理器编程》(2017),爱思唯尔公司:爱思唯尔公司,美国剑桥
[86] 程,J。;格罗斯曼,M。;McKercher,T.,专业CUDA c编程(2014),John Wiley&Sons,Inc.:印第安纳州印第安纳波利斯的John Wiley&Sons,Inc
[87] 黑格德·斯福。。MPGOS:用于大量独立常微分方程组的GPU加速积分器。布达佩斯技术经济大学,匈牙利布达佩斯;2019
[88] Nagy D.,Plavecz L.,Hegedűs F。。在gpu和cpu上求解大量非刚性、低维常微分方程组:MPGOS、ODEINT和微分方程的性能比较;2020年提交。
[89] www.gpuode.com。
[90] 阿纳特,K。;德米多夫。;《求解常微分方程》,第157期,穆兰斯基出版社,2014年·Zbl 1317.65155
[91] http://headmyshoulder.github.io/odeint-v2/。
[92] 梅丁,R。;凯洛斯,C。;Troia,A.,《声化学和气泡动力学》,《超声波声化学》,25,24-30(2015)
[93] 劳特伯恩,W。;Kurz,T.,《气泡振荡的物理》,Rep Prog Phys,73,10,106501(2010)
[94] 塔塔克,P.A。;潘伟迪,A.B.,腔动力学和空化产额的建模和实验研究:双频超声源的影响,化学工程科学,57,22,4987-4995(2002)
[95] 黑格德űs,F。;Klapcsik,K.,《高粘度对谐振激发气泡的崩塌样混沌和规则周期振荡的影响》,Ultrason Sonochem,27153-164(2015年)
[96] 克拉普西克。;Hegedʘs,F.,《粘性液体中声辐射下非球形气泡振荡的研究》,超声声化学,54256-273(2019年)
[97] Murray,L.,runge-Kutta积分器的GPU加速,IEEE T Parall发行版,23,1,94-101(2012)
[98] 德米多夫。;阿纳特,K。;鲁普,K。;Gottschling,P.,《编程CUDA和opencl:使用现代c++库的案例研究》,暹罗J Sci Comput,35,5,C453-C472(2013)·Zbl 1311.65179
[99] 史,Y。;绿色,W.H。;黄海伟。;Oluwole,O.O.,使用GPU和混合显式/隐式ODE积分加速多维燃烧模拟,燃烧火焰,159,72388-2397(2012)
[100] Le,H.P。;坎比尔,J.-L。;Cole,L.K.,基于GPU的详细化学动力学流动模拟,Comput Phys Commun,184,3596-606(2013)
[101] 奥马利,A。;阿诺德,J。;塔哈,T。;Schüttler,H.B.,使用多GPU和自适应runge-kutta-ODE解算器求解具有层次结构的大型非线性一阶常微分方程组,IEEE Access,1770-777(2013)
[102] 布洛克,B。;皮带,A。;比林斯,J.J。;Guidry,M.,大型动力网络的GPU加速显式集成,计算机物理杂志,302591-602(2015)·Zbl 1349.85002号
[103] 法扎纳罗,联邦调查局。;索里亚诺,哥伦比亚特区。;Suyama,R。;皇家马德里。;奥利维拉,J.R。;Muñoz,I.B.,使用并行计算的非线性动力系统的数值表征:GPU方法的作用,Commun非线性Sci Numer Simul,37143-162(2016)·Zbl 07247597
[104] 伊姆伦,A。;Haworth,D.C.,基于外推法的刚性ODE求解器的优点,燃烧火焰,174,1-15(2016)
[105] 科瓦茨,T。;哈伯,T。;里思,F.V。;Hens,N.,流行病学模型拟合和模拟的异构计算,BMC Bioinform,19,1,101(2018)
[106] 诺比尔,S.M。;卡扎尼加,P。;贝索齐,D。;Mauri,G.,Ginsoda:GPU上stiff ODE系统的大规模并行集成,J Supercomput,75,12,1-12(2018)
[107号] 南卡罗来纳州。;布朗,P.N。;格兰特,K.E。;李·S·L。;塞尔维亚语,R。;《日晷:非线性和微分/代数方程求解器套件》,ACM Trans Math Softw,31,3,363-396(2005)·Zbl 1136.65329
[108] https://computing.llnl.gov/projects/sundails。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。