×

通过转移流形的核嵌入降低复杂亚稳态系统的维数。 (英语) Zbl 1466.37068号

摘要:我们提出了一种新的基于核的机器学习算法,用于识别高维多尺度随机系统有效动力学的低维几何。最近,作者开发了一个计算此类系统最佳反应坐标的数学框架,该框架基于学习某个函数空间中低维过渡流形的参数化。在本文中,我们通过在再生核Hilbert空间中嵌入和学习这个转移流形,利用核嵌入的良好特性来增强这种方法。在核的温和假设下,流形结构在嵌入下保持不变,并且可以导出失真界。与以前的参数化方法相比,这导致了一种更稳健、更高效的算法。

MSC公司:

37M99型 动力系统的逼近方法和数值处理
68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 亚伯拉罕一世。;Bartal,Y。;Neiman,O.,《度量嵌入理论的进展》,高等数学。,228, 6, 3026-3126 (2011) ·Zbl 1250.46016号 ·doi:10.1016/j.aim.2011.08.003
[2] 巴克斯特,JR;Rosenthal,JS,各处正Markov链的收敛速度,Stat.Probab。莱特。,22, 4, 333-338 (1995) ·Zbl 0819.60056号 ·doi:10.1016/0167-7152(94)00085-M
[3] 贝伦森,H。;van der Spoel,D。;van Drunen,R.,《Gromacs:传递消息的并行分子动力学实现》,计算。物理。社区。,91, 1, 43-56 (1995) ·doi:10.1016/0010-4655(95)00042-E
[4] Berry,T。;Harlim,J.,可变带宽扩散核,应用。计算。谐波分析。,40, 1, 68-96 (2016) ·Zbl 1343.94020号 ·doi:10.1016/j.acha.2015.01.001
[5] 最佳,RB;Hummer,G.,过渡路径的反应坐标和速率,Proc。国家。阿卡德。科学。,102196732-6737(2005年)·doi:10.1073/pnas.0408098102
[6] Bittracher,A。;科尔泰,P。;Klus,S。;巴尼什,R。;Dellnitz,M。;Schütte,C.,《复杂亚稳态系统的过渡流形:有效动力学的理论和数据驱动计算》,《非线性科学杂志》。,28, 2, 471-512 (2017) ·Zbl 06860496号 ·doi:10.1007/s00332-017-9415-0
[7] Bittracher,A。;巴尼什,R。;Schütte,C.,分子反应坐标的数据驱动计算,化学杂志。物理。,149, 15, 154103 (2018) ·doi:10.1063/1.5035183
[8] Bouvrie,J.,Hamzi,B.:再生核Hilbert空间中非线性控制系统的平衡约简。摘自:第48届Allerton通信、控制和计算年会论文集,第294-301页(2010)
[9] Bouvrie,J。;Hamzi,B.,非线性系统某些关键量近似的内核方法,J.Compute。动态。,4, 1, 1-19 (2017) ·Zbl 1394.37115号 ·doi:10.3934/jcd.2017001
[10] Bouvrie,J。;Hamzi,B.,非线性系统近似的核方法,SIAM J.控制优化。,55, 4, 2460-2492 (2017) ·Zbl 1368.93248号 ·数字对象标识码:10.1137/14096815X
[11] 鲍曼,G。;沃列兹,V。;潘德,VS,《控制蛋白质折叠的复杂性》,Curr。操作。结构。生物学,21,1,4-11(2011)·doi:10.1016/j.sbi.2010.10.006
[12] 鲍曼,GR;潘德,VS;Noé,F.,《马尔可夫状态模型及其在长期分子模拟中的应用导论》(2014),柏林:斯普林格出版社,柏林·Zbl 1290.92004年
[13] CJ卡马乔;Thirumalai,D.,模型蛋白质折叠的动力学和热力学,Proc。国家。阿卡德。科学。,90, 13, 6369-6372 (1993) ·doi:10.1073/pnas.90.13.6369
[14] 切克马雷夫,DS;石田,T。;Levy,RM,丙氨酸二肽在水溶液中的长期构象转变:连续和离散状态动力学模型,J.Phys。化学。B、 108、50、19487-19495(2004)·doi:10.1021/jp048540w
[15] 科伊夫曼,RR;Kevrekidis,IG公司;拉丰,S。;Maggioni,M。;Nadler,B.,《扩散图、约简坐标和随机系统的低维表示》,多尺度模型。模拟。,7, 2, 842-864 (2008) ·Zbl 1175.60058号 ·doi:10.1137/070696325
[16] Duvenaud,D.、Lloyd,J.、Grosse,R.、Tenenbaum,J.和Zoubin,G.:通过成分核搜索在非参数回归中发现结构。收录于:Dasgupta,S.,McAllester,D.:(eds),《第30届国际机器学习会议论文集》,《机器学习研究论文集》第28卷,第1166-1174页,美国佐治亚州亚特兰大,2013年6月17-19日。PMLR公司
[17] E、 W.,Vanden-Eijnden,E.:过渡路径理论。《统计物理学杂志》。123(3), 503-523 (2006) ·Zbl 1101.82016年
[18] E、 W.,Ren,W.,Vanden-Eijnden,E.:研究罕见事件的字符串方法。物理。版本B 66,052301(2002)·Zbl 1050.60068号
[19] E、 W.,Ren,W.,Vanden-Eijnden,E.:简化和改进的字符串方法,用于计算跨越障碍事件中的最小能量路径。化学杂志。物理。126(16), 164103 (2007)
[20] Elber,R。;贝洛·里瓦斯,JM;马,P。;卡德纳斯,AE;Fathizadeh,A.,用磨石法计算iso-commitor曲面作为最佳反应坐标,熵,19,5,219(2017)·doi:10.3390/e19050219
[21] 波兰弗雷多利诺;Harrison,CB公司;刘,Y。;Schulten,K.,《蛋白质折叠模拟的挑战:时间尺度、表征和分析》,《自然物理学》。,6, 10, 751 (2010) ·doi:10.1038/nphys1713
[22] TA Frewen;悍马,G。;Kevrekidis,IG,《使用粗逆向整合探索有效潜在景观》,J.Chem。物理。,131、13、10B603(2009)·doi:10.1063/1.3207882
[23] 弗罗伊兰,G。;佐治亚州哥特瓦尔德;Hammerlindl,A.,《分析多尺度系统的无轨迹框架》,Phys。D非线性现象。,328, 34-43 (2016) ·Zbl 1366.65065号 ·doi:10.1016/j.physd.2016.04.010
[24] Fukumizu,K.,Gretton,A.,Sun,X.,Schölkopf,B.:条件依赖的核心度量。摘自:《第20届神经信息处理系统国际会议论文集》,NIPS’07,第489-496页(2007)
[25] Gaspar,P。;Carbonell,J。;Oliveira,JL,《关于二值分类支持向量机的参数优化》,J.Integr。生物信息。,9, 3, 33-43 (2012) ·doi:10.1515/jib-2012-201
[26] 格苏阿,GD;Lelièvre,T。;佩特雷卡,DL;Nectouxa,B.,跳跃马尔可夫模型和过渡态理论:准静态分布方法,法拉第讨论。,195, 469-495 (2016) ·doi:10.1039/C6FD00120C
[27] Gönen,M。;Alpaydin,E.,《多核学习算法》,J.Mach。学习。第12、64、2211-2268号决议(2011年)·Zbl 1280.68167号
[28] 格雷顿,A。;博格沃德,KM;拉什,MJ;朔尔科普夫,B。;Smola,A.,《内核双样本测试》,J.Mach。学习。《决议》,723-773年3月13日(2012年)·Zbl 1283.62095号
[29] 亨特,B。;Kaloshin,V.,无限维分形集嵌入有限维空间的正则性,非线性,12,5,1263-1275(1999)·Zbl 0932.28006号 ·doi:10.1088/0951-7715/12/5/303
[30] Klein,R.,大气流动的尺度相关模型,年度。流体力学版次。,42, 1, 249-274 (2010) ·Zbl 1213.86002号 ·doi:10.1146/annurev-fluid-121108-145537
[31] Klus,S。;Bittracher,A。;舒斯特,I。;Schütte,C.,基于核的分子构象分析方法,化学杂志。物理。,149, 24, 244109 (2018) ·doi:10.1063/1.5063533
[32] Klus,S。;纽斯克,F。;科尔泰,P。;Wu,H。;凯夫雷基迪斯,I。;舒特,C。;Noé,F.,数据驱动模型简化和传递算子近似,J.非线性科学。,28, 985-1010 (2018) ·兹比尔1396.37083 ·doi:10.1007/s00332-017-9437-7
[33] Klus,S。;舒斯特,I。;Muandet,K.,再生核Hilbert空间中转移算子的特征组合,J.非线性科学。,30, 1, 283-315 (2020) ·Zbl 1437.37104号 ·数字对象标识代码:10.1007/s00332-019-09574-z
[34] Kruskal,JB,通过优化非度量假设的拟合优度实现多维尺度,《心理测量学》,29,1,1-27(1964)·兹伯利0123.36803 ·doi:10.1007/BF02289565
[35] 李,JA;Verleysen,M.,《降维质量评估:基于等级的标准》,神经计算,72,7,1431-1443(2009)·doi:10.1016/j.neucom.2008.12.017
[36] AJ Majda;Klein,R.,热带系统多尺度模型,J.Atmos。科学。,60, 2, 393-408 (2003) ·doi:10.1175/1520-0469(2003)060<0393:SMMFTT>2.0.CO;2
[37] 马特,A。;Pasquali,L。;Wu,H。;Noé,F.,Vampnets for deep learning of molecular dynamics,国家通讯社。,9, 1, 5 (2018) ·doi:10.1038/s41467-017-02388-1
[38] 马丁利,JC;Stuart,AM,粒子运动的某些亚椭圆扩散的几何遍历性,马尔可夫过程。相关。Fields,8,2,199-214(2002)·Zbl 1014.60059号
[39] 麦吉本,RT;比利时Husic;潘德,VS,从复杂动力学中识别简单反应坐标,化学杂志。物理。,146, 4, 44109 (2017) ·doi:10.1063/1.4974306
[40] Melzer,T.,Reiter,M.,Bischof,H.:使用广义正则相关分析的非线性特征提取。收录:Dorffner,G.,Bischof,H.,Hornik,K.(编辑),《人工神经网络-ICANN 2001》,第353-360页(2001)·Zbl 1005.68935号
[41] Mercer,J.,《正负型函数及其与积分方程理论的联系》,Philos。事务处理。R.Soc.伦敦。数学。物理。工程科学。,209, 441-458, 415-446 (1909) ·JFM 40.0408.02号文件
[42] Muandet,K。;Fukumizu,K。;Sriperumbudur,B。;Schölkopf,B.,Kernel意指发行版的嵌入:回顾和超越,Found。趋势马赫数。学习。,10,1-2,1-141(2017)·Zbl 1380.68336号 ·doi:10.1561/2200000060
[43] Müller,K.,多维能量超曲面上的反应路径,Angewandte Chemie Int.Ed.Engl。,19, 1, 1-13 (1980) ·doi:10.1002/anie.198000013
[44] Munkres,JR,Topology(2000),《上鞍河:普伦蒂斯·霍尔》,上鞍河·Zbl 0951.54001号
[45] 纳德勒,B。;拉丰,S。;科伊夫曼,RR;Kevrekidis,IG,扩散图,动力学系统的光谱聚类和反应坐标,应用。计算。哈蒙。分析。,21, 1, 113-127 (2006) ·Zbl 1103.60069号 ·doi:10.1016/j.acha.2005.07.004
[46] 不,F。;舒特,C。;Vanden-Eijnden,E。;Reich,L。;Weikl,TR,从短期非平衡模拟构建折叠路径的完整集合,Proc。国家。阿卡德。科学。,106, 45, 19011-19016 (2009) ·Zbl 1254.92001年 ·doi:10.1073/pnas.0905466106
[47] 奥瓦迪,H。;Yoo,GR,《内核流:从数据中学习内核到深渊》,J.Compute。物理。,389, 22-47 (2019) ·Zbl 1452.65028号 ·doi:10.1016/j.jcp.2019.03.040
[48] 普林斯,J-H;Wu,H。;萨里奇,M。;凯勒,B。;Senne,M.先生。;持有,M。;乔德拉,JD;舒特,C。;Noé,F.,《分子动力学的马尔可夫模型:生成和验证》,J.Chem。物理。,134, 17, 174105 (2011) ·数字对象标识代码:10.1063/1.3565032
[49] Roweis,ST;Saul,LK,通过局部线性嵌入降低非线性维数,《科学》,29055002326(2000)·doi:10.1126/science.290.5500.2323
[50] MJ Schervish;卡林,BP,《关于连续替代抽样的收敛性》,J.Compute。图表。《法律总汇》第1、2、111-127页(1992年)
[51] 朔尔科普夫,B。;Smola,AJ,《使用内核学习:支持向量机、正则化、优化和超越》(2001),剑桥:麻省理工学院出版社,剑桥
[52] 朔尔科普夫,B。;Smola,A。;Müller,K-R,作为核特征值问题的非线性分量分析,神经计算。,10, 5, 1299-1319 (1998) ·doi:10.1162/08997669830017467
[53] 朔尔科普夫,B。;Muandet,K。;Fukumizu,K。;Harmeling,S。;Peters,J.,通过再生核Hilbert空间表示计算随机变量的函数,统计计算。,25, 4, 755-766 (2015) ·兹比尔1331.62206 ·doi:10.1007/s11222-015-9558-5
[54] 舒特,C。;Sarich,M.,《分子动力学中的亚稳定性和马尔可夫状态模型:建模、分析、算法方法》。普罗维登斯:美国数学学会,普罗维登斯库兰特讲稿(2013)第24名·Zbl 1305.60004号 ·doi:10.1090/cln/024
[55] 施万特斯,CR;Pande,VS,用tICA和核技巧模拟分子动力学,J.Chem。理论计算。,11, 2, 600-608 (2015) ·doi:10.1021/ct5007357
[56] Smith,PE,《溶液中丙氨酸二肽自由能表面》,J.Chem。物理。,111, 12, 5568-5579 (1999) ·doi:10.1063/1.479860
[57] Smola,A.,Gretton,A.,Song,L.,Schölkopf,B.:分布的希尔伯特空间嵌入。摘自:《第18届算法学习理论国际会议论文集》,第13-31页。Springer-Verlag(2007)·Zbl 1142.68407号
[58] 新泽西州索契;Onuchic,JN;Wolynes,PG,蛋白质折叠漏斗反应坐标的扩散动力学,化学杂志。物理。,第104、15、5860-5868页(1996年)·doi:10.1063/1.471317
[59] Sriperumbudur,BK;格雷顿,A。;Fukumizu,K。;朔尔科普夫,B。;Lanckriet,GR,Hilbert空间嵌入和概率度量,J.Mach。学习。第11号决议,1517-1561(2010年)·Zbl 1242.60005号
[60] 斯坦瓦特,I。;Christmann,A.,支持向量机(2008),纽约:Springer,纽约·兹比尔1203.68171
[61] Vanden-Eijnden,E。;Venturoli,M.,《修正反应管和自由能计算的有限温度串法》,化学杂志。物理。,130, 19, 194103 (2009) ·doi:10.1063/1.3130083
[62] Young,FW,《多维尺度:历史、理论和应用》(2013),纽约:心理学出版社,纽约
[63] 张伟。;哈特曼,C。;Schütte,C.,给定反应坐标下的有效动力学,反应速率理论,法拉第讨论。,195, 365-394 (2016) ·doi:10.1039/C6FD00147E
[64] Zwanzig,R.,《不可逆热力学中的记忆效应》,物理学。修订版,124983-992(1961年)·Zbl 0131.45006号 ·doi:10.103/物理版本124.983
[65] Zwanzig,R.,《非平衡统计力学》(2001),牛津:牛津大学出版社,牛津·Zbl 1267.82001年
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。