×

熵在指导连接证明程序中的作用。 (英语) Zbl 07532518号

Das,Anupam(编辑)等人,《使用分析表和相关方法的自动推理》。第30届国际会议,2021年9月6日至9日,英国伯明翰,TABLEAUX 2021。诉讼程序。查姆:斯普林格。莱克特。票据计算。科学。12842, 218-235 (2021).
总结:在这项工作中,我们研究了如何学习好的算法来选择定理证明中的推理步骤。我们在由实现的连接表演算中对此进行了探讨精益CoP其中部分画面提供了一个简洁的概念状态可以应用有限数量的推论。我们首先将最先进的学习算法——图形神经网络(GNN)——纳入plCoP公司定理证明器。然后,我们使用它来观察系统在强化学习环境中的行为,即当从许多问题上的成功Monte-Carlo树搜索中学习推理指导时。尽管GNN具有更好的模式匹配能力,但它最初的性能比以前使用的更简单的学习算法差。我们观察到,较简单的算法信心较低,即其建议具有较高的熵。这使我们探索了通过神经网络实现的推理选择的熵如何影响证明搜索。这与不确定性下人类决策的研究有关,尤其是概率匹配理论。我们的主要结果表明,适当的熵正则化,即训练GNN不过度自信,可以大大提高plCoP公司在大型数学语料库上的表现。
关于整个系列,请参见[Zbl 1486.68013号].

MSC公司:

第68卷第15页 定理证明(自动和交互式定理证明、演绎、解析等)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿拉马,J。;Heskes,T。;Kühlwein,D。;Tsivtsivadze,E。;Urban,J.,《通过语料库分析和核方法进行数学前提选择》,J.Autom。原因。,52, 2, 191-213 (2014) ·兹比尔1315.68217 ·doi:10.1007/s10817-013-9286-5
[2] Alemi,A.A.,Chollet,F.,Een,N.,Irving,G.,Szegedy,C.,Urban,J.:DeepMath-前提选择的深度序列模型。摘自:《第30届神经信息处理系统国际会议论文集》,NIPS 2016,美国,第2243-2251页。Curran Associates Inc.(2016年)
[3] Anthony,T.,Tian,Z.,Barber,D.:通过深度学习和树搜索快速思考和缓慢思考。CoRR,abs/1705.08439(2017)
[4] Bansal,K.,Loos,S.M.,Rabe,M.N.,Szegedy,C.,Wilcox,S.:HOList:高阶逻辑定理证明的机器学习环境。摘自:Chaudhuri,K.,Salakhutdinov,R.(编辑)国际机器学习会议,ICML 2019。机器学习研究论文集,第97卷,第454-463页。PMLR(2019)
[5] 比贝尔,W。;施密特,RA;Nalon,C.,《基于连接方法的自动演绎愿景》,《使用分析表和相关方法的自动推理》,3-21(2017),Cham:Springer,Cham·Zbl 1496.68363号 ·doi:10.1007/978-3-319-66902-1_1
[6] Blaauwbroek,L.,Urban,J.,Geuvers,H.:考克证明助理的战术学习和证明。摘自:Albert,E.,Kovács,L.(编辑)LPAR 2020:第23届编程、人工智能和推理逻辑国际会议。EPiC计算机系列,第73卷,第138-150页。EasyChair(2020年)·Zbl 1455.68242号
[7] Browne,C.,蒙特卡罗树搜索方法综述,IEEE Trans。计算。因特尔。人工智能游戏,4,1-43(2012)·doi:10.1109/TCIAIG.2012.2186810
[8] Chen,T.,Guestrin,C.:XGBoost:一个可扩展的树木提升系统。摘自:《第22届ACM SIGKDD国际知识发现和数据挖掘会议论文集》,KDD 2016,美国纽约州纽约市,第785-794页。ACM(2016)
[9] 科瓦洛夫斯克。;雅库布v,J。;苏达,M。;Urban,J。;Fontaine,P.,ENIGMA-NG:E的高效神经和梯度支持推理指南,自动演绎-CADE 27,197-215(2019),查姆:斯普林格,查姆·Zbl 07178977号 ·doi:10.1007/978-3-030-29436-6_12
[10] 考证助理。http://coq.inia.fr·Zbl 1039.68543号
[11] Crouse,M.等人:一种用于一阶逻辑定理证明的深度强化学习方法。人工智能(2019)。arXiv公司
[12] Färber,M。;Kaliszyk,C。;Urban,J.,连接表的机器学习指南,J.Autom。原因。,65, 2, 287-320 (2021) ·Zbl 07356974号 ·doi:10.1007/s10817-020-09576-7
[13] Gauthier,T.,Kaliszyk,C.,Urban,J.:战术脚趾:学习用HOL4战术进行推理。收录:Eiter,T.,Sands,D.(编辑)LPAR-21。第21届国际程序设计、人工智能和推理逻辑会议。《计算中的EPiC系列》,第46卷,第125-143页。EasyChair(2017年)·兹比尔1403.68224
[14] Gauthier,T。;Kaliszyk,C。;厄本,J。;库马尔,R。;诺里什,M.,《战术脚趾:学习用战术证明》,J.Autom。原因。,65, 2, 257-286 (2021) ·Zbl 07356973号 ·数字对象标识代码:10.1007/s10817-020-09580-x
[15] MJC戈登;Melham,TF,《HOL简介:高阶逻辑的定理证明环境》(1993),剑桥:剑桥大学出版社,剑桥·Zbl 0779.68007号
[16] 哈里森,J。;Srivas,M。;Camilleri,A.,《HOL light:教程导论》,《计算机辅助设计中的形式方法》,265-269(1996),海德堡:斯普林格·doi:10.1007/BFb0031814
[17] Huang,D.,Dhariwal,P.,Song,D.,Sutskever,I.:Gamepad:定理证明的学习环境。参加:2019年ICLR第七届国际学习代表大会。OpenReview.net(2019)
[18] 雅库布v,J。;科瓦洛夫斯克。;奥尔沙克,M。;Piotrowski,B。;苏达,M。;Urban,J。;北卡罗来纳州佩尔蒂埃。;Sofronie-Stokkermans,V.,《ENIGMA anonymous:符号相关推理引导机(系统描述)》,《自动推理》,448-463(2020),查姆:斯普林格,查姆·Zbl 07614690号 ·doi:10.1007/978-3-030-51054-1_29
[19] 雅库布v,J。;Urban,J。;Geuvers,H。;英格兰,M。;O.哈桑。;拉贝,F。;Teschke,O.,ENIGMA:高效基于学习的推理引导机,《智能计算机数学》,292-302(2017),查姆:斯普林格,查姆·Zbl 1367.68249号 ·数字对象标识代码:10.1007/978-3-319-62075-6_20
[20] Jakubov,J.,Urban,J.:通过学习条款指导锤击Mizar。收录于:Harrison,J.、O'Leary,J.和Tolmach,A.(编辑)第十届交互式定理证明国际会议,2019年9月9日至12日,美国俄勒冈州波特兰市,ITP 2019。LIPIcs,第141卷,第34:1-34:8页。达格斯图尔宫(Schloss Dagstuhl)-莱布尼兹·泽特鲁姆(Leibniz-Zentrum für Informatik)(2019年)
[21] Kaliszyk,C.,Urban,J.:M2K数据集。https://github.com/JUrban/dephmath/blob/master/M2k_list(网址:https://github.com/JUrban/dephmath/blob/master/M2k_list)
[22] Kaliszyk,C.,Urban,J.:Mizar40数据集。https://github.com/JUrban/deepmath
[23] Kaliszyk,C。;Urban,J。;Davis,M。;Fehnker,A。;McIver,A。;Voronkov,A.,FEMaLeCoP:相当有效的机器学习连接证明程序,《编程逻辑、人工智能和推理》,88-96(2015),海德堡:斯普林格·Zbl 1471.68312号 ·doi:10.1007/978-3-662-48899-77
[24] Kaliszyk,C。;Urban,J.,MizAR 40代表MizAR 40,J.Autom。原因。,55, 3, 245-256 (2015) ·Zbl 1356.68191号 ·doi:10.1007/s10817-015-9330-8
[25] Kaliszyk,C.,Urban,J.,Michalewski,H.,Olsák,M.:定理证明的强化学习。收录于:NeurIPS,第8836-8847页(2018年)
[26] Kaliszyk,C.,Urban,J.,Vyskočil,J.:大型理论自动推理的有效语义特征。摘自:Yang,Q.,Wooldridge,M.(编辑)IJCAI 2015,第3084-3090页。AAAI出版社(2015)
[27] Kocsis,L。;塞佩斯瓦里,C。;Fürnkranz,J。;Scheffer,T。;Spiliopoulou,M.,基于Bandit的Monte-Carlo规划,机器学习:ECML 2006,282-293(2006),海德堡:斯普林格·doi:10.1007/11871842-29
[28] Kovács,L。;沃伦科夫,A。;北卡罗来纳州Sharygina。;Veith,H.,《一阶定理证明与吸血鬼》,计算机辅助验证,1-35(2013),海德堡:施普林格出版社·doi:10.1007/978-3-642-39799-8_1
[29] Loos,S.M.、Irving,G.、Szegedy,C.、Kaliszyk,C.:深度网络引导的证明搜索。参加:第21届程序设计、人工智能和推理逻辑国际会议(2017)·Zbl 1403.68197号
[30] 穆罕默德,OA;穆尼奥斯,C。;Tahar,S.,《高阶逻辑中的定理证明》(2008),海德堡:施普林格,海德堡·Zbl 1149.68013号 ·doi:10.1007/978-3-540-71067-7
[31] Nagashima,Y.,He,Y.:PaMpeR:Isabelle/HOL的证明方法推荐系统。收录于:Huchard,M.、Kästner,C.、Fraser,G.(编辑)《第33届ACM/IEEE自动化软件工程国际会议论文集》,ASE 2018,法国蒙彼利埃,2018年9月3-7日,第362-372页。ACM(2018)
[32] Olsák,M.,Kaliszyk,C.,Urban,J.:用于自动推理的属性不变量嵌入。摘自:Giacomo,G.D.等人(编辑)ECAI 2020-24欧洲人工智能会议,西班牙圣地亚哥-德孔波斯特拉,2020年8月29日至9月8日,包括第十届人工智能著名应用会议(PAIS 2020)。《人工智能与应用前沿》,第325卷,第1395-1402页。IOS出版社(2020)·Zbl 1464.68317号
[33] Otten,J。;Armando,A。;鲍姆加特纳,P。;Dowek,G.,leanCoP 2.0和ileanCoP 1.2:经典和直觉逻辑中的高性能精益定理证明(系统描述),《自动推理》,283-291(2008),海德堡:斯普林格·Zbl 1165.68467号 ·doi:10.1007/978-3-540-71070-7_23
[34] Otten,J。;Bibel,W.,leanCoP:基于精益连接的定理证明,J.Symb。计算。,36, 139-161 (2003) ·Zbl 1025.68076号 ·doi:10.1016/S0747-7171(03)00037-3
[35] Rawson,M.,Reger,G.:自动定理证明,快速和缓慢。EasyChair预印本编号4433。EasyChair(2020年)
[36] Ross,S.,Gordon,G.,Bagnell,D.:将模仿学习和结构化预测减少为无梯度在线学习。收录:Gordon,G.、Dunson,D.、Dudík,M.(编辑)《第十四届国际人工智能与统计会议论文集》。《机器学习研究论文集》,佛罗里达州劳德代尔堡,美国,2011年4月11日至13日,第15卷,第627-635页。PMLR(2011)
[37] 斯卡塞利,F。;戈里,M。;佐伊,AC;Hagenbuchner,M。;Monfardini,G.,图神经网络模型,Trans。诺尔。净值。,20, 1, 61-80 (2009) ·doi:10.10109/TNN.200.2005605
[38] Schulz,S.,E-Brainiac定理证明器,AI Commun。,第15页,第2页,第3页,第111-126页(2002年)·Zbl 1020.68084号
[39] 舒尔茨,S。;麦克米兰,K。;米德尔多普,A。;Voronkov,A.,《系统描述:E 1.8,编程、人工智能和推理逻辑》,735-743(2013),海德堡:斯普林格·Zbl 1407.68442号 ·doi:10.1007/978-3-642-45221-549
[40] Silver,D.,《在没有人类知识的情况下掌握围棋游戏》,《自然》,550,354(2017)·doi:10.1038/nature24270
[41] Slind,K.,Norrish,M.:HOL4的简要概述。摘自:Mohamed等人[30],第28-32页·Zbl 1165.68474号
[42] Suda,M.:改进Enigma-style子句选择指南的新技术。参加:国际自动扣除会议,CADE 2021(2021)
[43] 萨顿,RS;Barto,AG,《强化学习:导论》(2018),剑桥:麻省理工学院出版社,剑桥·Zbl 1407.68009号
[44] Urban,J.:ERC项目AI4Reason最终科学报告(2021年)。http://grid01.ciirc.cvut.cz/mptp/ai4reason/PR_CORE_SCIENTIFIC_4.pdf
[45] Urban,J.,Sutcliffe,G.,Pudlák,P.,Vyskočil,J.:MaLARea SG1-带语义指导的自动推理机器学习器。收录于:IJCAR,第441-456页(2008年)·Zbl 1165.68434号
[46] Urban,J。;维斯科契尔,J。;Štěpánek,p。;Brünnler,K。;Metcalfe,G.,MaLeCoP机器学习连接证明程序,使用分析表和相关方法的自动推理,263-277(2011),海德堡:斯普林格·Zbl 1332.68206号 ·doi:10.1007/978-3642-22119-421
[47] Vulkan,N.,《经济学家对概率匹配的观点》,J.Econ。调查。,14, 1, 101-118 (2000) ·网址:10.1111/1467-6419.00106
[48] Wenzel,M.,Paulson,L.C.,Nipkow,T.:伊莎贝尔框架。摘自:Mohamed等人[30],第33-38页·Zbl 1165.68478号
[49] 威廉姆斯,RJ;Peng,J.,使用连接主义强化学习算法的函数优化,Connect。科学。,3241-268年3月3日(1991年)·网址:10.1080/09540099108946587
[50] Yang,K.,Deng,J.:通过与证明助手的互动学习证明定理。在:Chaudhuri,K.,Salakhuttinov,R.(编辑)第36届机器学习国际会议论文集,ICML 2019,美国加利福尼亚州长滩,2019年6月9日至15日。机器学习研究论文集,第97卷,第6984-6994页。PMLR(2019年)
[51] 佐姆博里。;Urban,J。;布朗,CE;北卡罗来纳州佩尔蒂埃。;Sofronie-Stokkermans,V.,Prolog技术强化学习证明,自动推理,489-507(2020),Cham:Springer,Cham·Zbl 07614694号 ·doi:10.1007/978-3-030-51054-1_33
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。