文件Zbl 07843827-zbMATH打开

Dzanic，T。;米塔尔，K。;D.金。;杨，J。;彼得里德斯，S。;基思，B。;R.安德森。

DynAMO：用于动态预期网格优化的多智能体强化学习，应用于双曲守恒律。（英语） Zbl 07843827号

J.计算。物理学。 506，文章ID 112924，37 p.（2024）.

小结：我们介绍了DynAMO，一种用于动态预期网格优化的强化学习范式。自适应网格细化是优化偏微分方程数值方法计算成本和求解精度的有效工具。然而，用于时间相关问题的传统自适应网格细化方法通常仅依赖瞬时误差指标来指导自适应性。因此，标准策略通常需要频繁重网格以保持准确性。在DynAMO方法中，多智能体强化学习用于发现新的局部细化策略，这些策略可以通过生成网格来预测和响应未来的解决方案状态，从而在更长的时间间隔内提供更准确的解决方案。通过将DynAMO应用于二维线性平流和可压缩Euler方程的间断Galerkin方法，我们证明了这种新的网格细化方法可以优于传统的基于阈值的策略，同时还可以推广到不同的网格尺寸、重网格和模拟时间以及初始条件。

MSC公司：

65M50型	涉及偏微分方程初值和初边值问题数值解的网格生成、细化和自适应方法
65M60毫米	涉及偏微分方程初值和初边值问题的有限元、Rayleigh-Ritz和Galerkin方法

关键词：

自适应网格细化;有限元方法;科学机器学习;强化学习;双曲守恒律组

软件：

货币基金组织;PyMFEM公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

参考文献：

[1]	Tomohiro Takaki；福冈，丰一；Tomita，Yoshihiro，使用自适应有限元方法对二元合金定向凝固期间的相场模拟，J.Cryst。增长，283，1263-2782005
[2]	洛伦茨·伯杰；拉斐尔·博尔达斯；大卫·凯；Tadere，Simon，有限应变三场多孔弹性的稳定有限元方法，计算。机械。，60, 1, 51-68, 2017 ·Zbl 1386.74134号
[3]	萨维什·库马尔；奥亚尔苏阿，里卡多；瑞兹·拜尔，里卡多；Sandilya，Ruchi，多孔弹性新四场公式的保守间断有限体积和混合格式，ESAIM:Math。模型。数字。分析。，54, 1, 273-299, 2020 ·Zbl 1511.65114号
[4]	丹尼尔·基茨曼（Daniel Kitzmann）；博尔特，简；Beate，A。；Patzer，C.，球对称辐射传输的间断Galerkin有限元方法，Astron。天体物理学。，595，A90，2016
[5]	Van de Vosse，F.N。；德哈特，J。；Van Oijen，C.H.G.A。；贝塞姆斯，D。；冈瑟，T.W.M。；西格尔，A。；Wolters，B.J.B.M。；Stijnen，J.M.A。；Baaijens，F.P.T.，基于有限元的心血管流体-结构相互作用计算方法，J.Eng.Math。，47, 335-368, 2003 ·Zbl 1057.74047号
[6]	罗兰·贝克尔；Rannacher，Rolf，《有限元法中后验误差估计的最优控制方法》，《数值学报》。，2001年5月10日至102日·Zbl 1105.65349号
[7]	威廉·泰森（William C.Tyson）。；Swirydowicz，Katarzyna；约瑟夫·德拉加（Joseph M.Derlaga）。；克里斯托弗·罗伊。；de Sturler，Eric，《改进的基于函数的误差估计和无伴随自适应》（第46届AIAA流体动力学会议，2016年6月，美国航空航天研究所）
[8]	威廉·泰森（William C.Tyson）。；Roy，Christopher J.，《有限体积CFD的高阶误差估计框架》，J.Compute。物理。，394632-6572019年10月·Zbl 1452.76136号
[9]	威廉·泰森（William C.Tyson）。；Yan，Gary K。；克里斯托弗·罗伊。；Ollivier-Gooch，Carl F.，任意高阶误差估计误差传输方程的重线性化，J.Compute。物理。，397，第108867条pp.，2019年11月·Zbl 1453.65282号
[10]	王红玉；Roy，Christopher J.，《间断Galerkin方法的误差传输方程实现》，J.Compute。物理。，474，第111760条，第2023年2月·Zbl 07640532号
[11]	阿扎姆穆萨维；tefnescu，Rzvan；Sandu，Adrian，局部降阶模型误差和维数的多元预测，国际数值杂志。方法工程，113，3，512-533，2017年10月
[12]	马丁·德罗曼；Carlberg，Kevin，简化阶模型误差统计建模的ROMES方法，SIAM/ASA J.不确定性。量化。，2015年1月3日，116-145·Zbl 1322.65029号
[13]	戴克，D.N。；Lowther，D.A。；McFee，S.，《使用神经网络技术确定近似有限元网格密度》，IEEE Trans。马格纳。，28, 2, 1767-1770, 1992
[14]	马西耶·帕森斯基；Grzeszczuk，拉法ł；大卫·帕尔多（David Pardo）；Demkowicz，Leszek，深度学习驱动的自适应hp有限元方法，（国际计算科学会议，2021年，施普林格），114-121
[15]	托马斯·S·u·亚历克；拉法·格拉泽兹祖克；塞尔吉奥·罗哈斯；维托尔德·德兹温；Paszyñski，Maciej，通过深度神经网络预测，准最优hp-有限元单元向奇异性细化，计算。数学。申请。，142157-1742023年7月·Zbl 07691992号
[16]	安德鲁·吉列（Andrew Gillette）；布伦丹·基思；彼得里德斯，苏格拉底，学习自适应网格细化的稳健标记策略，SIAM J.Sci。计算。，第46页，A264-A2892023·Zbl 1532.65119号
[17]	Bohn，Jan；Feischl，Michael，递归神经网络作为最优网格细化策略，计算。数学。申请。，97, 61-76, 2021 ·Zbl 1524.65759号
[18]	陈国栋；Fidkowski，Krzysztof，使用卷积神经网络的基于输出的误差估计和网格自适应：标量平流扩散问题的应用，（AIAA科学技术2020论坛，2020年），1143
[19]	陈国栋；Fidkowski，Krzysztof J.，使用卷积神经网络的基于输出的自适应气动模拟，计算。流体，223，文章104947页，2021·Zbl 1521.76280号
[20]	查克拉波蒂，阿扬；托马斯·威克（Thomas Wick）；庄小英；Rabczuk，Timon，使用深度神经网络进行面向多目标的双向剩余误差估计，2021年
[21]	朱利安·罗斯（Julian Roth）；马克斯·施罗德；Wick，Thomas，双重加权残差估计中的神经网络引导伴随计算，SN应用。科学。，4, 2, 1-17, 2022
[22]	Chedid，R。；Najjar，N.，《使用人工神经网络自动生成有限元网格——第一部分：网格密度预测》，IEEE Trans。马格纳。，32, 5, 5173-5178, 1996
[23]	Pfaff，托拜厄斯；迈尔·福图纳托；阿尔瓦罗桑切斯·冈萨雷斯；Battaglia，Peter W.，使用图网络学习基于网格的模拟，2020，arXiv预印本
[24]	黄，基夫；克里格纳，莫里茨；阿利斯泰尔·布朗（Alistair Brown）；弗里德里希·门霍恩（Friedrich Menhorn）；汉斯·约阿希姆·本加茨（Hans-Joachim Bungartz）；Hartmann，Dirk，计算流体动力学中基于机器学习的最优网格生成，2021，arXiv预印本
[25]	张哲言；王永兴；彼得·基马克（Peter K.Jimack）。；Meshingnet，He Wang，Meshingnet:一种基于深度学习的新网格生成方法，（国际计算科学会议，2020年，施普林格），186-198
[26]	宋文斌；张明瑞；Joseph G.《墙饰》。；高俊鹏；田，郑；孙芳蕾；马修·皮戈特（Matthew D.Piggott）。；陈俊清；石左强；Chen，Xiang，M2N：PDE解算器的网格运动网络，2022，arXiv预印本
[27]	Chan、Chiu Ling；费利克斯·舒尔茨（Felix Scholz）；Takacs，Thomas，基于卷积神经网络的线性弹性问题的局部精细四元网格划分，2022，arXiv预印本
[28]	杨佳晨；Dzanic、Tarik；彼得森，布伦登；Kudo，Jun；科坦·米塔尔；弗拉基米尔·托莫夫；Jean-Sylvane卡米尔；赵拓；查、宏远；扎尼奥·科列夫；罗伯特·安德森（Robert Anderson）；丹尼尔·法索尔（Daniel Faissol），《自适应网格细化的强化学习》（Reinforction learning for adaptive mesh refinentification），第26届国际人工智能与统计会议论文集。第26届人工智能与统计学国际会议论文集，2023年4月25-27日。第26届国际人工智能与统计会议论文集。第26届人工智能与统计国际会议论文集，2023年4月25-27日，机器学习研究论文集，第206卷，2023，PMLR），5997-6014
[29]	杨佳晨；科坦·米塔尔；Dzanic、Tarik；彼得里德斯，苏格拉底；布伦丹·基思；彼得森，布伦登；丹尼尔·法索尔（Daniel Faissol）；Anderson，Robert，用于自适应网格细化的多智能体强化学习，（《2023年自治智能体和多智能体系统国际会议论文集》，2023年国际自治智能体与多智能体会议论文集，AAMAS’23，2023），14-22
[30]	Niklas Freymuth；菲利普·达林格；沃思，托拜厄斯；路易斯·卡格尔；Neumann，Gerhard，Swarm reinforction learning for adaptive mesh refinence，2023年
[31]	科尔宾·福卡特；亚伦·查卢斯；Lermusiaux，Pierre F.J.，自适应网格细化的深度强化学习，J.Compute。物理。，第491条，第112381页，2023年·Zbl 07771296号
[32]	Hesthaven，Jan S。；Tim Warburton，Nodal间断Galerkin方法，2008，Springer:Springer纽约·Zbl 1134.65068号
[33]	Rusanov，V.V.，《非平稳冲击波与障碍物相互作用的计算》，苏联计算。数学。数学。物理。，1962年1月1日、2日、304-320
[34]	Davis，S.F.，简化二阶Godunov型方法，SIAM J.Sci。统计计算。，1988年5月9日、3日、445-473日·兹比尔0645.65050
[35]	理查德·萨顿（Richard S.Sutton）。；Andrew G.Barto，《强化学习：导论》，2018年，麻省理工学院出版社·Zbl 1407.68009号
[36]	Puterman，Martin L.，《马尔可夫决策过程：离散随机动态规划》，2014年，John Wiley&Sons·Zbl 0829.90134号
[37]	弗兰斯·奥利埃霍克（Frans A.Oliehoek）。；Christopher Amato，《去中心化POMDP简介》，2016年，斯普林格出版社·Zbl 1355.68005号
[38]	约翰·舒尔曼；Filip Wolski；Prafulla Dhariwal；亚历克·拉德福德；Klimov，Oleg，Proximal policy optimization algorithms，2017，arXiv预印本
[39]	Tan，Ming，多智能体强化学习：独立与合作智能体，（第十届机器学习国际会议论文集，1993），330-337
[40]	Chang，Yu-Han；何特蕾西；Leslie P.Kaelbling，《所有学习都是局部的：全球奖励游戏中的多智能体学习》（Advances in Neural Information Processing Systems，2004），807-814
[41]	安德森，R。；安德烈·J。；巴克，A。；Bramwell，J。；卡米尔，J.-S。；塞维尼，J。；Dobrev，V。；Y.杜杜伊特。；费希尔，A。；科列夫，Tz。；Pazner，W。；斯托维尔，M。；托莫夫，V。；阿克曼，I。；Dahm，J。；麦地那，D。；Zampini，S.，MFEM：模块化有限元方法库，Compute。数学。申请。，81, 42-74, 2021 ·Zbl 1524.65001号
[42]	pymfem，pymfem:模块化有限元方法[软件]，2022
[43]	伯纳多·科克伯恩（Bernardo Cockburn）；Shu，Chi-Wang，Runge-Kutta对流占优问题的间断Galerkin方法，科学杂志。计算。，16, 3, 173-261, 2001 ·Zbl 1065.76135号
[44]	蒂莫西·巴特；Jespersen，Dennis，《非结构网格上迎风方案的设计和应用》（第27届航空航天科学会议，1989年1月，美国航空航天研究所）
[45]	卡斯滕森，卡斯滕；Michael Feischl；佩奇，马库斯；普雷托利乌斯，德克，自适应公理，计算。数学。申请。，67, 6, 1195-1253, 2014 ·兹比尔135065119
[46]	齐恩基维茨，乌列吉尔德·塞西尔；朱建忠，超收敛补丁恢复和后验误差估计。第1部分：回收技术，国际期刊Numer。方法工程，33,1331-13641992·Zbl 0769.73084号
[47]	齐恩基维茨，乌列吉尔德·塞西尔；朱建忠，超收敛补丁恢复和后验误差估计。第2部分：误差估计和自适应性，国际数学家杂志。方法工程，33,1365-13821992·Zbl 0769.73085号
[48]	梁，埃里克；理查德·利奥（Richard Liaw）；Robert Nishihara；菲利普·莫里茨；罗伊·福克斯；Ken Goldberg；约瑟夫·冈萨雷斯（Joseph Gonzalez）；迈克尔·乔丹（Michael Jordan）；Stoica，Ion，RLlib:分布式强化学习的抽象，（机器学习国际会议，2018年，PMLR），3053-3062
[49]	Carsten W.Schulz-Rinen。；詹姆斯·柯林斯。；Glaz，Harland M.，二维气体动力学Riemann问题的数值解，SIAM J.Sci。计算。，1993年11月14日、6日、1394-1414日·Zbl 0785.76050号
[50]	理查德·里斯卡（Richard Liska）；Wendroff，Burton，Euler方程一维和二维测试问题上几种差分格式的比较，SIAM J.Sci。计算。，2003年1月25日、3日、995-1017日·Zbl 1096.65089号
[51]	Peter D.Lax。；刘旭东，用正格式求解二维气体动力学黎曼问题，SIAM J.Sci。计算。，1998年1月19日、2日、319-340日·Zbl 0952.76060号

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b：book；一：图书文章）

一&b	逻辑和
一\|b	逻辑或
!ab公司	逻辑非
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

DynAMO：用于动态预期网格优化的多智能体强化学习，应用于双曲守恒律。（英语） Zbl 07843827号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

DynAMO：用于动态预期网格优化的多智能体强化学习，应用于双曲守恒律。 （英语） Zbl 07843827号

MSC公司：

关键词：

软件：

参考文献：

DynAMO：用于动态预期网格优化的多智能体强化学习，应用于双曲守恒律。（英语） Zbl 07843827号