×

大脑Branes:通过深度强化学习探索弦真空。 (英语) Zbl 1416.83125号

摘要:我们提出深度强化学习作为探索弦真空景观的无模型方法。作为一个具体的应用,我们使用一个称为异步优势actor-critic的人工智能代理来探索具有交叉D6-结构的IIA型紧化。当通过更改D6系列配置来探索不同的字符串背景配置时,代理将收到与字符串一致性条件和接近标准模型真空有关的奖惩。这些反过来被用于更新代理的策略和价值神经网络,以改进其行为。通过强化学习,代理在两个任务中的性能都得到了显著提高,并且对于某些任务,它发现的解决方案比随机游走者多出一个因子(mathcal{O}(200))。在一个案例中,我们证明了代理学习了一种由人派生的策略,用于查找一致的字符串模型。在另一种情况下,在不存在人工衍生策略的情况下,代理学习一种真正的新策略,该策略在单位时间内以两倍的效率实现相同的目标。我们的结果表明,代理可以同时学习求解各种弦论一致性条件,这些条件是用非线性耦合丢番图方程表示的。

MSC公司:

83E30个 引力理论中的弦和超弦理论
81T30型 弦理论和超弦理论;量子场论中的其他扩展对象(如膜)

关键词:

超弦真空;D膜
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] S.Ashok和M.R.Douglas,《计算通量真空》,JHEP01(2004)060[hep-th/0307049]【灵感】·Zbl 1243.83060号 ·doi:10.1088/1126-6708/2004/01/060
[2] W.Taylor和Y.-N.Wang,具有最大通量真空的F理论几何,JHEP12(2015)164[arXiv:1511.03209][灵感]·Zbl 1388.81367号
[3] J.Halverson,C.Long和B.Sung,F-理论紧化中的算法普遍性,物理学。版次D 96(2017)126006[arXiv:1706.02299]【灵感】。
[4] W.Taylor和Y.-N.Wang,扫描4D F-理论景观的骨架,JHEP01(2018)111[arXiv:1710.11235][灵感]·Zbl 1384.83066号
[5] R.Altman,J.Carifio,J.Halverson和B.D.Nelson,使用方程学习器估计Calabi-Yau超曲面和三角剖分计数,JHEP03(2019)186[arXiv:1811.06490][INSPIRE]·Zbl 1414.83080号 ·doi:10.07/JHEP03(2019)186
[6] W.Lerche,D.Lüst和A.Schellekens,自对偶格的手性四维异质串,Nucl。物理学。B第287(1987)477条·doi:10.1016/0550-3213(87)90115-5
[7] F.Denef和M.R.Douglas,景观的计算复杂性。一、 《物理学年鉴》322(2007)1096[hep-th/0602072][灵感]·兹比尔1113.83007
[8] J.Halverson和F.Ruehle,场和弦理论中真空和近真空的计算复杂性,物理学。版本D 99(2019)046015[arXiv:1809.08279]【灵感】。
[9] M.Cvetić,I.Garcia-Etxebarria和J.Halverson,《弦论景观中非微扰有效势的计算:IIB/F理论视角》,Fortsch。Phys.59(2011)243[arXiv:1009.5386]【灵感】·Zbl 1209.81162号 ·doi:10.1002/prop.201000093
[10] Y.-H.He,深入了解风景,arXiv:1706.02714[灵感]。
[11] D.Krefl和R.-K.Seong,Calabi-Yau卷的机器学习,物理。版次D 96(2017)066014[arXiv:1706.03346]【灵感】。
[12] F.Ruehle,用遗传算法进化神经网络来研究字符串景观,JHEP08(2017)038[arXiv:1706.07024][INSPIRE]·Zbl 1381.83128号 ·doi:10.1007/JHEP08(2017)038
[13] J.Carifio、J.Halverson、D.Krioukov和B.D.Nelson,《字符串环境中的机器学习》,JHEP09(2017)157[arXiv:1707.00655][灵感]·兹比尔1382.81155 ·doi:10.1007/JHEP09(2017)157
[14] D.Klaewer和L.Schlechter,复曲面簇中超曲面的机器学习线丛上同调,物理学。莱特。B 789(2019)438[arXiv:1809.02547]【灵感】·Zbl 1406.14001号
[15] J.Liu,《宇宙景观中的人工神经网络》,JHEP12(2017)149[arXiv:1707.02800][INSPIRE]·Zbl 1383.85016号 ·doi:10.1007/JHEP12(2017)149
[16] Y.-N.Wang和Z.Z.Zhang,学习4D F-理论中的非Higgable规范群,JHEP08(2018)009[arXiv:1804.07296][灵感]。 ·doi:10.1007/JHEP08(2018)009
[17] R.Jinno,反弹计算的机器学习,arXiv:1805.12153[INSPIRE]。
[18] K.Bull、Y.-H.He、V.Jejjala和C.Mishra,机器学习CICY三倍,Phys。莱特。B 785(2018)65[arXiv:1806.03121]【灵感】。
[19] T.Rudelius,《学会膨胀》,JCAP02(2019)044[arXiv:1810.05159][灵感]·Zbl 07484857号 ·doi:10.1088/1475-7516/2019/02/044
[20] V.Jejjala、A.Kar和O.Parrikar,《深入学习纽结的双曲线体积》,arXiv:1902.05547【灵感】·Zbl 1430.57001号
[21] K.Hashimoto、S.Sugishita、A.Tanaka和A.Tomiya,深度学习和全息QCD,物理。D 98版(2018)106014[arXiv:1809.10536]【灵感】。
[22] A.Cole和G.Shiu,弦乐景观的拓扑数据分析,JHEP03(2019)054[arXiv:1812.06960][INSPIRE]·兹伯利1414.83083 ·doi:10.07/JHEP03(2019)054
[23] A.Mütter、E.Parr和P.K.S.Vaudrevange,《异质性球状景观中的深度学习》,Nucl。物理学。B 940(2019)113[arXiv:1811.05993]【灵感】·兹比尔1409.81099 ·doi:10.1016/j.nuclphysb.2019.013
[24] I.J.Goodfellow等人,《生成性对抗网络》,arXiv:1406.2661[INSPIRE]·Zbl 1436.68322号
[25] H.Erbin和S.Krippendorf,生成EFT模型的GANs,arXiv:1809.02612[灵感]·Zbl 1472.81155号
[26] J.Carifio等人,弦几何网络上宇宙学的真空选择,物理学。修订稿121(2018)101602[arXiv:1711.06685]【灵感】。 ·doi:10.1103/PhysRevLett.121.101602
[27] D.Silver等人,《掌握深度神经网络和树搜索的围棋游戏》,Nature529(2016)484·doi:10.1038/nature16961
[28] D.Silver等人,《在没有人类知识的情况下掌握围棋游戏》,Nature550(2017)354·doi:10.1038/nature24270
[29] I.Bello等人,具有强化学习的神经组合优化,arXiv:1611.09940。
[30] R.S.Sutton和A.G.Barto,《强化学习:导论》,美国麻省理工学院出版社(1998年)·Zbl 1407.68009号
[31] D.Silver,伦敦大学学院RL课程,http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html。
[32] G.Brockman等人,Openai健身房,arXiv:1606.01540。
[33] V.Mnih等人,深度强化学习的异步方法,arXiv:1602.01783。
[34] R.Williams,神经网络强化学习的一类梯度估计算法,载于ICNN、M.Caudill和C.Butler编辑的IEEE,美国纽约(1987)。
[35] R.J.Williams,连接强化学习的简单统计梯度允许算法,机器学习8(1992)229·Zbl 0772.68076号
[36] V.Mnih等人,《通过深度强化学习进行人类层面的控制》,《自然》518(2015)529·doi:10.1038/nature14236
[37] M.Birck等人,《多任务强化学习:混合a3c域方法》(2017年)。
[38] M.R.Douglas和W.Taylor,交叉膜模型的景观,JHEP01(2007)031[hep-th/0606109][灵感]。 ·doi:10.1088/1126-6708/2007/01/031
[39] A.M.Uranga,D膜探针,RR蝌蚪抵消和k理论电荷,Nucl。物理学。B 598(2001)225[hep-th/0011048]【灵感】·Zbl 1046.81543号
[40] E.Witten,《SU(2)异常》,Phys。莱特。B 117(1982)324【灵感】。
[41] F.Gmeiner等人,十亿分之一:MSSM-like D-brane统计,JHEP01(2006)004[hep-th/0510170][INSPIRE]。
[42] M.R.Douglas,《弦/M理论真空的统计》,JHEP05(2003)046[hep-th/0303194][灵感]。 ·doi:10.1088/1126-6708/2003/05/046
[43] B.S.Acharya、F.Denef和R.Valandro,M理论真空的统计,JHEP06(2005)056[hep-th/0502060][灵感]。 ·doi:10.1088/1126-6708/2005/06/056
[44] E.I.Buchbinder,A.Constantin和A.Lukas,异质线束模型的模空间:四次曲面的案例研究,JHEP03(2014)025[arXiv:1311.1941][INSPIRE]。 ·doi:10.1007/JHEP03(2014)025
[45] M.Cvetić,J.Halverson,D.Klevers和P.Song,《关于IIB型紧化的有限性:椭圆Calabi-Yau上的三重磁化膜》,JHEP06(2014)138[arXiv:1403.4943][INSPIRE]·兹比尔1333.81321 ·doi:10.1007/JHEP06(2014)138
[46] S.Groot Nibbelink、O.Loukas、F.Ruehle和P.K.S.Vaudrevange,来自异株系束的无限多MSSM?,物理学。版本D 92(2015)046002[arXiv:1506.00879]【灵感】。
[47] V.Mnih等人,深度强化学习的异步方法,arXiv:1602.01783。
[48] S.Tokui、K.Oono、S.Hido和J.Clayton,Chainer:下一代开放源码深度学习框架,《神经信息处理系统(NIPS)第二十届年会机器学习系统(LearningSys)研讨会论文集》,12月7日至12日,加拿大蒙特利尔(2015)。
[49] M.Cvetić,T.Li和T.Liu,交叉D6-骨架的超对称Pati-Salam模型:通往标准模型的道路,Nucl。物理学。B 698(2004)163[hep-th/0403061][灵感]·兹比尔1123.81392 ·doi:10.1016/j.nuclphysb.2004.07.036
[50] M.Bukov等人,《量子控制不同阶段的强化学习》,《物理学》。修订版X 8(2018)031086。
[51] R.Sweke等人,容错量子计算的强化学习解码器,arXiv:1810.07207。
[52] V.Rosenhaus和W.Taylor,交叉膜景观尾部的多样性,JHEP06(2009)073[arXiv:0905.1951][INSPIRE]。 ·doi:10.1088/1126-6708/2009/06/073
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。