×

GANs和闭包:多尺度建模中的微观-宏观一致性。 (英语) Zbl 07752609号

摘要:从蛋白质折叠到材料发现,对分子系统的相空间进行采样,以及更广泛地说,对由随机微分方程(SDE)有效建模的复杂系统进行采样,是许多领域中至关重要的建模步骤。这些问题在本质上通常是多尺度的:它们可以用低维有效自由能曲面来描述,该曲面由少量“慢”反应坐标参数化;剩余的“快速”自由度填充到平衡度量中有条件的关于反应坐标值。此类问题的抽样程序用于估计有效自由能差以及与条件平衡分布相关的集合平均值;后一种平均值导致有效简化动态模型的关闭。多年来,发展了结合分子模拟的增强采样技术;他们经常使用系统阶参数的知识来采样相应的条件平衡分布,并估计观测值的集合平均值。机器学习(ML)领域出现了一个有趣的类比,生成性对抗网络(GAN)可以从低维概率分布中生成高维样本。这种样本生成在无方程多尺度建模中被称为“提升过程”:它从低维表示的信息中返回模型状态的合理(或现实)高维空间实现。在这项工作中,我们详细阐述了这个类比,并提出了一种方法基于物理条件分布抽样的模拟和偏置方法基于ML用于相同任务的条件生成对抗网络(cGAN)。我们用来限制精细尺度实现的“粗糙描述符”可以是预先已知的,也可以通过非线性降维(这里,使用扩散映射)来学习。我们认为,这可能会带来这两种方法的最佳特征:我们证明,将cGAN与基于物理的增强采样技术相结合的框架可以改进多尺度SDE动态系统采样,甚至显示出增加复杂性的系统(这里是简单分子)的前景。

MSC公司:

82立方米7 统计力学中的计算分子动力学
2005年3月37日 动力系统仿真
35卢比60 随机偏微分方程的偏微分方程
82D60型 聚合物统计力学
68问题32 计算学习理论
68T07型 人工神经网络与深度学习
82立方32 神经网络在含时统计力学问题中的应用
60J65型 布朗运动
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Pearson,K.,《关于空间中最接近点系统的线和平面》,伦敦-爱丁堡-都柏林-菲洛斯出版社。《科学杂志》。,2(1901年),第559-572页。
[2] Kramer,M.A.,使用自联想神经网络的非线性主成分分析,Aiche。J.,37(1991),第233-243页。
[3] Tenenbaum,J.B.、de Silva,V.和Langford,J.C.,《非线性降维的全球几何框架》,《科学》,290(2000),第2319-2323页。
[4] Roweis,S.T.和Saul,L.K.,通过局部线性嵌入减少非线性维数,《科学》,290(2000),第2323-2326页。
[5] Coifman,R.R.和Lafon,S.,扩散图,应用。计算。哈蒙。分析。,21(2006),第5-30页·Zbl 1095.68094号
[6] Torrie,G.M.和Valleau,J.P.,《蒙特卡罗自由能估算中的非物理抽样分布:伞形抽样》,J.Compute。物理。,23(1977年),第187-199页。
[7] Goodfellow,I.J.、Pouget-Abadie,J.、Mirza,M.、Xu,B.、Warde-Farley,D.、Ozair,S.、Courville,A.和Bengio,Y.,《生成对抗网络》,https://arxiv.org/abs/1406.2661, 2014.
[8] Song,Y.、Sohl-Dickstein,J.、Kingma,D.P.、Kumar,A.、Ermon,S.和Poole,B.,《基于分数的随机微分方程生成模型》,https://arxiv.org/abs/2011.3456, 2020.
[9] Song,Y.和Ermon,S.,训练基于分数的生成模型的改进技术,https://arxiv.org/abs/2006.09011, 2020.
[10] Dhariwal,P.和Nichol,A.,扩散模型在图像合成方面击败了GAN,https://arxiv.org/abs/2105.05233, 2021.
[11] Soize,C.和Ghanem,R.,数据驱动的概率集中和流形采样,J.Compute。物理。,321(2016),第242-258页·Zbl 1349.62202号
[12] Soize,C.和Ghanem,R.,流形上的概率学习,Found。数据科学。,2(2020年),第279-307页。
[13] Karras,T.、Laine,S.和Aila,T.,《生成对抗性网络的基于风格的生成器架构》,https://arxiv.org/abs/1812.04948, 2019.
[14] Mirza,M.和Osindero,S.,《条件生成对抗网》,arXiv:1411.17842014年。
[15] Zwanzig,R.W.,用微扰法求解高温状态方程。I.非极性气体,《化学杂志》。物理。,22(1954年),第1420-1426页。
[16] Darve,E.、Rodríguez-Gómez,D.和Pohorille,A.,用于标量和矢量自由能量计算的自适应偏压法,J.Chem。物理。,128 (2008), 144120.
[17] Laio,A.和Parrinello,M.,《逃离自由能源最低限度》,Proc。国家。阿卡德。科学。美国,99(2002),第12562-12566页。
[18] Chiavazzo,E.、Covino,R.、Coifman,R.R.、Gear,C.W.、Georgiou,A.S.、Hummer,G.和Kevrekidis,I.G.,未知有效自由能源景观的内在地图动力学探索,Proc。国家。阿卡德。科学。美国,114(2017),第E5494-E5503页。
[19] Belkacemi,Z.、Gkeka,P.、Lelièvre,T.和Stoltz,G.,《使用自动编码器和偏置轨迹追踪集体变量》,化学杂志。理论计算。,18(2022),第59-78页。
[20] Sidky,H.、Chen,W.和Ferguson,A.L.,《分子潜在空间模拟器》,化学。科学。,11(2020年),第9459-9467页。
[21] Kumar,S.、Rosenberg,J.M.、Bouzida,D.、Swendsen,R.H.和Kollman,P.A.,生物分子自由能计算的加权直方图分析方法。I.方法,J.计算。化学。,13(1992年),第1011-1021页。
[22] Shirts,M.R.和Chodera,J.D.,《多重平衡态样品的统计优化分析》,J.Chem。物理。,129 (2008), 124105.
[23] Coifman,R.R.和Lafon,S.,《几何谐波:经验函数多尺度样本外扩展的新工具》,应用。计算。哈蒙。分析。,21(2006),第31-52页·Zbl 1095.68095号
[24] Dietrich,F.、Bello-Rivas,J.M.和Kevrekidis,I.G.,《高斯过程与几何谐波之间的对应》,https://arxiv.org/abs/2110.02296, 2021.
[25] Rasmussen,C.E.和Williams,C.K.I.,机器学习的高斯过程(自适应计算和机器学习),麻省理工学院出版社,马萨诸塞州剑桥,2005年。
[26] Wang,J.和Ferguson,A.L.,《软材料和生物材料模拟中的非线性机器学习》,Mol.Simulat。,44(2018),第1090-1107页。
[27] Kingma,D.P.和Welling,M.,自动编码变分贝叶斯,https://arxiv.org/abs/1312.6114, 2013.
[28] Zheng,W.,Rohrdanz,M.A.和Clementi,C.,利用扩散映射定向分子动力学快速探索构型空间,J.Phys。化学。B、 117(2013),第12769-12776页。
[29] Laing,C.R.、Frewen,T.A.和Kevrekidis,I.G.,神经场模型中活动突变的粗粒度动力学,非线性,20(2007),第2127-2146页·Zbl 1125.60061号
[30] Long,A.W.和Ferguson,A.L.,《通过景观工程合理设计片状胶体》,分子系统。设计。《工程师》,3(2018),第49-65页。
[31] Arjovsky,M.、Chintala,S.和Bottou,L.,Wasserstein生成对抗性网络,《第34届机器学习国际会议论文集》,Precup,D.和Teh,Y.W.编辑,PMLR,2017,第214-223页。
[32] Ding,X.,Wang,Y.,Xu,Z.,Welch,W.J.和Wang,Z.J.,CcGAN:用于图像生成的连续条件生成对抗网络,国际学习表征会议,2021年。
[33] 马哈拉诺比斯,P.C.,《统计学中的广义距离》,Proc。自然科学研究所。印度,2(1936年),第49-55页·Zbl 0015.03302号
[34] Singer,A.和Coifman,R.R.,带扩散图的非线性独立成分分析,应用。计算。哈蒙。分析。,25(2008年),第226-239页·Zbl 1144.62044号
[35] Dsilva,C.J.、Ronen Talmon,C.W.G.、Coifman,R.R.和Kevrekidis,I.G.,一类多尺度快-慢随机动力系统的数据驱动约简,SIAM J.Appl。动态。系统。,15(2016),第1327-1351页,doi:10.1137/151004896·Zbl 1353.37151号
[36] Itô,K.,随机积分,Proc。帝国理工学院。,20(1944年),第519-524页·Zbl 0060.29105号
[37] Vlachas,P.R.、Zavadlav,J.、Praprotnik,M.和Koumoutsakos,P.,《通过有效动力学学习加速分子系统模拟》,J.Chem。理论计算。,18(2022年),第538-549页。
[38] Mironov,V.、Alexeev,Y.、Mulligan,V.K.和Fedorov,D.G.,丙氨酸二肽中最小值的系统研究,J.Compute。化学。,40(2019年),第297-309页。
[39] Kabsch,W.,关联两组向量的最佳旋转解决方案,Acta Crystallogr。A、 32(1976年),第922-923页。
[40] Kevrekidis,I.G.,Gear,C.W.,Hyman,J.M.,Kevreki dis,P.G.、Runborg,O.和Theodoropoulos,C.,无方程、粗粒度多尺度计算:使微观模拟器能够执行系统级分析,Commun。数学。科学。,1(2003年),第715-762页·Zbl 1086.65066号
[41] Georgiou,A.S.、Bello-Rivas,J.M.、Gear,C.W.、Wu,H.-T.、Chiavazzo,E.和Kevrekidis,I.G.,《能量梯度驱动的随机模拟器的探索算法》,《熵》,19(2017),294。
[42] Khas-minskii,R.Z.,随机微分方程的平均原理,Probl。Peredachi Inf.,4(1968),第86-87页·Zbl 0279.60047号
[43] Freidlin,M.I.和Wentzell,A.D.,《动力系统的随机扰动》,施普林格出版社,柏林,2012年·Zbl 1267.60004号
[44] Vanden-Eijnden,E.,具有随机效应的多尺度动力系统的数值技术,Commun。数学。科学。,1(2003年),第385-391页·Zbl 1088.60060号
[45] Legoll,F.和Lelièvre,T.,使用条件期望的有效动力学,非线性,23(2010),第2131-2163页·Zbl 1209.60036号
[46] Hartmann,C.、Neureither,L.和Sharma,U.,《不可逆随机微分方程的粗粒化:定量结果和与平均值的联系》,SIAM J.Math。分析。,52(2020),第2689-2733页,doi:10.1137/19M1299852·Zbl 1447.35028号
[47] Gear,C.W.,Kaper,T.J.,Kevrekidis,I.G.和Zagaris,A.,《向慢流形的投影:奇异扰动系统和遗留代码》,SIAM J.Appl。动态。系统。,4(2005),第711-732页,doi:10.1137/040608295·Zbl 1170.34343号
[48] Vandekerckhove,C.、Sonday,B.、Makeev,A.、Roose,D.和Kevrekidis,I.G.,计算低速流形上粗尺度稳态和一致初始化的常用方法,计算。化学。《工程》,35(2011),第1949-1958页。
[49] Maruyama,G.,《连续马尔可夫过程和随机方程》,《Rendiconti del Circolo Matematico di Palermo》,第4期(1955年),第48-90页·Zbl 0053.40901号
[50] Eastman,P.,Swails,J.,Chodera,J.D.,McGibbon,R.T.,Zhao,Y.,Beauchamp,K.A.,Wang,L.-P.,Simmonett,A.C.,Harrigan,M.P.,Stern,C.D.,Wiewiora,R.P.,Brooks,B.R.,and Pande,V.S.,OpenMM 7:分子动力学高性能算法的快速开发,PLOS计算。《生物学》,13(2017),第1-17页。
[51] Case,D.,Babin,V.,Berryman,J.,Betz,R.,Cai,Q.,Cerutti,D.,Cheatham,T.,Darden,T。
[52] Mongan,J.、Simmerling,C.、McCammon,J.A.、Case,D.A.和Onufriev,A.,具有简单、稳健的分子体积校正的广义born模型,J.Chem。理论计算。,3(2007年),第156-169页。
[53] Plumed Consortium,《促进增强分子模拟的透明度和再现性》,Nat.Methods,16(2019),第670-673页。
[54] Tribello,G.A.、Bonomi,M.、Branduardi,D.、Camiloni,C.和Bussi,G.,《羽毛2:老鸟的新羽毛》,Comput。物理学。社区。,185(2014),第604-613页。
[55] Bonomi,M.、Branduardi,D.、Bussi,G.、Camilloni,C.、Provasi,D.、Raiteri,P.、Donadio,D.、Marinelli,F.、Pietrucci,F.,Broglia,R.A.和Parrinello,M.,Plumed:一个用于分子动力学自由能计算的便携式插件Computed。物理学。社区。,180(2009),第1961-1972页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。