×

人工智能能在数学奥林匹克竞赛中赢得奖牌吗对大学前问题的机械化数学进行基准测试。 (英语) Zbl 1462.68152号

摘要:本文介绍了一个机械化数学的基准问题库,包括计算机代数和自动定理证明。该图书馆包括从习题书、大学入学考试和国际数学奥林匹克竞赛中提取的大学前数学问题。课程包括实代数、几何、数论、微积分、微积分和组合学。因此,它包括了大学前数学各个领域的问题以及各种困难。与其他现有的基准库不同,这个库包含一些问题,这些问题是经过形式化处理的,因此可以通过自然语言表达的原始问题的机械翻译来实现。换句话说,该库旨在支持机械化数学和自然语言处理技术的集成,以实现端到端自动数学问题解决的目标。本文还介绍了我们在图书馆端到端系统的原型推理组件的初步实验结果。图书馆通过互联网公开。

MSC公司:

68T01型 人工智能的一般主题
00A07年 问题书
68伏15 定理证明(自动和交互式定理证明、演绎、解析等)
68V20型 数学形式化与定理证明
68瓦30 符号计算和代数计算
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] B.Akbarpour和L.C.Paulson,MetiTarski:实值特殊函数的自动定理证明器,《自动推理杂志》44(3)(2010),175-205。doi:10.1007/s10817009-9149-2·Zbl 1215.68206号
[2] N.H.Arai,无割Gentzen型命题演算与置换推理的可拓性,理论计算机科学170(1)(1996),129-144。doi:10.1016/S03043975(96)80704-3·Zbl 0874.03065号
[3] N.H.Arai和R.Masukawa,《如何发现组合问题中隐藏的对称性》,载于《第八届符号计算与机械化推理集成研讨会论文集》,2000年·Zbl 0986.68126号
[4] R.Atkey、P.Johann和A.Kennedy,代数索引类型的抽象和不变性,收录于:第40届ACM SIGPLAN-SIGACT编程语言原理研讨会论文集。2013年POPL’13,美国纽约州纽约市ACM,第87-100页,http://doi.acm.org/10.1145/ 2429069.2429082. ·Zbl 1301.68183号
[5] J.Avigad、R.Y.Lewis和C.Roux,真实不等式的启发式证明,《自动推理杂志》56(3)(2016),367-386。doi:10.1007/s10817-015-9356-y·Zbl 1356.68174号
[6] C.Barrett、A.Stump和C.Tinelli,可满足性模理论库(SMT-LIB),2010年,www.SMT-LIB.org。
[7] D.G.Bobrow,计算机问题解决系统的自然语言输入,博士论文,麻省理工学院,1964年。
[8] J.Bos,《用拳击手进行广义语义分析》,载《文本处理中的语义》。STEP 2008会议记录。《计算语义学研究》,J.Bos和R.Delmonte主编,学院出版物,2008年,第277-286页。doi:10。3115/1626481.1626503.
[9] R.Bradford、J.H.Davenport、M.England、S.McCallum和D.Wilson,真值表不变柱面代数分解,符号计算杂志76(2016),1-35。doi:10.1016/j.jsc.2015.111.002·Zbl 1351.68314号
[10] C.W.Brown,开放非均匀柱面代数分解,收录于:2015年ACM符号和代数计算国际研讨会论文集。ISSAC’15,ACM,美国纽约州纽约市,2015年,第85-92页。doi:10。1145/2755996.2756654. ·Zbl 1346.68273号
[11] C.Chen和M.Moreno Maza,基于规则链的圆柱形代数分解的量词消去,符号计算杂志75(C)(2016),74-93。doi:10。1016/j.jsc.2015年11月1日·兹比尔1398.68695
[12] S.Clark和J.R.Curran,使用CCG和对数线性模型的广义高效统计分析,计算语言学33(2007)。doi:10.1162/coli.2007.33.4.493·Zbl 1234.68402号
[13] J.H.Davenport和J.Heintz,实量词消除是双指数的,符号计算杂志5(1-2)(1988),29-35,http://www.sciencedirect.com/科学/文章/pii/S074771718880004X。doi:10.1016/S07477171(88)80004-X·Zbl 0663.03015号
[14] L.A.Dennis、J.Gow和C.Schurmann,归纳定理证明v1.0的挑战问题,技术报告ULCS07-004,利物浦大学计算机科学系,2007年。
[15] M.England和J.H.Davenport,《柱面代数分解的启发式、基准和标准的经验》,摘自:与第18届科学计算符号和数字算法国际研讨会(SYNASC 2016)合办的第一届可满足性检查和符号计算研讨会论文集,罗马尼亚提米苏拉,2016年9月24日,E.ábrahám、J.H.Davenport和P.Fontaine主编,《CEUR研讨会论文集》,第1804卷,CEUR-WS.org,2016年,第24-31页,http://ceur-ws.org/Vol-1804/paper-06.pdf。
[16] R.Fukasaku、H.Iwane和Y.Sato,《改进CGS-QE算法》,载于:第六届计算机和信息科学数学方面国际会议的修订论文集——第9582卷。MACIS 2015,Springer-Verlag Inc.,美国纽约州纽约市,2016年,第231-235页·Zbl 1460.13051号
[17] J.P.Gelb,《自然语言问题解决系统实验》,载《第二届国际人工智能联合会议论文集》。IJCAI'71,摩根考夫曼出版社,美国加利福尼亚州旧金山,1971年,第455-462页。
[18] A.Grabowski、A.Korniłowicz和A.Naumowicz,《形式化推理杂志》3(2)(2010),153-245·Zbl 1211.68369号
[19] J.Harrison,《不失概括性》,载于:《高阶逻辑中的定理证明》,第22届国际会议,TPHOLs 2009,Proceedings,Munich,Germany,August 17-20,2009,pp.43-59。doi:10.1007/978-3642-0335993·Zbl 1252.68254号
[20] H.H.Hoos和T.Stützle,《SATLIB:SAT研究的在线资源》,IOS出版社,2000年,第283-292页·Zbl 0979.68128号
[21] M.J.Hosseini、H.Hajishirzi、O.Etzioni和N.Kushman,学习用动词分类解决算术单词问题,收录于:2014年自然语言处理实证方法会议论文集,EMNLP,卡塔尔多哈,2014年10月25-29日,ACL特别利益小组SIGDAT会议,2014年,第523-533页,http://aclweb.org/antology/D/D14/D14-1058.pdf。doi:10.3115/v1/D14-1058。
[22] H.Iwane和H.Anai,使用几何不变性消除实量词的公式简化,见:2017年第42届符号和代数计算国际研讨会论文集(ISSAC-2017)·Zbl 1457.68326号
[23] H.Iwane、T.Matsuzaki、N.Arai和H.Anai,通过实量子化消除自动解决自然语言几何数学问题,收录于:第十届自动演绎国际研讨会论文集(ADG2014),2014年,第75-84页。
[24] H.Iwane、H.Yanami、H.Anai和K.Yokoyama,符号数字柱面代数的有效实现·Zbl 1291.68433号
[25] C.Kaliszyk、G.Sutcliffe和F.Rabe,TH1:TPTP型高阶形式与秩-1多态性,摘自:第五届自动推理实践方面研讨会论文集(PAAR 2016),2016年,第41-55页。
[26] M.Kerber和M.Pollet,《数学知识管理的难题》,收录于:数学知识管理,施普林格出版社,2006年,第81-95页。doi:10.1007/11618027_6·Zbl 1151.68665号
[27] M.Kobayashi、H.Iwane、T.Matsuzaki和H.Anai,《非Renex公式实量词消除的有效子公式指令》,载于:《计算机和信息科学的数学方面——第六届国际会议》,MACIS 2015年,修订论文集,德国柏林,2015年11月11日至13日,第236-251页。doi:10.1007/978-3-319-32859-121·Zbl 1460.68086号
[28] R.Koncel Kedziorski,H.Hajishirzi,A.Sabharwal,O.Etzioni和S.Ang,将代数单词问题解析为方程,计算语言学协会汇刊3(2015),585-597,https://transacl.org/ojs/index.php/tacl网站/文章/view/692。
[29] N.Kushman、Y.Artzi、L.Zettlemoyer和R.Barzilay,《学习自动解决代数单词问题》,载于:计算语言学协会第52届年会论文集,第1卷:长篇论文,计算语言学协会,马里兰州巴尔的摩,2014年,第271-281页,http://www.aclweb.org/文选/第14-1026页。doi:10.3115/v1/P14-1026。
[30] T.Kwiatkowksi,L.Zettlemoyer,S.Goldwater和M.Steedman,从逻辑形式中归纳概率CCG文法并进行高阶统一,收录于:《2010年自然语言处理经验方法会议论文集》,计算语言学协会,2010年,第1223-1233页。
[31] 松崎、伊藤、伊万、阿奈和阿来,《大学前数学问题的语义分析》,载于《计算语言学协会第55届年会论文集》。计算语言学协会,2017年,即将出版。
[32] T.Matsuzaki、H.Iwane、H.Anai和N.H.Arai,《最缺乏创造力的考生:走向广泛覆盖的自然语言数学问题解决的第一步》,载于《第二十届AAAI人工智能会议论文集》,2014年,第1098-1104页。
[33] T.Matsuzaki、H.Iwane、M.Kobayashi、Y.Zhan、R.Fukasaku、J.Kudo、H.Anai和N.H.Arai,《与青少年赛跑——对大学前问题的机械化数学进行基准测试》,载于:《自动推理——第八届国际联合会议》,2016年,葡萄牙科英布拉,6月27日,N.Olivetti和A.Tiwari主编,会议记录。《计算机科学讲义》,第9706卷,斯普林格出版社,2016年,第213-227页,2016年7月2日·Zbl 1475.68459号
[34] T.Matsuzaki、M.Kobayashi和N.H.Arai,《表征变化的信息处理:国际数学奥林匹克问题不仅对人类来说很难》,载于:《认知科学学会第38届年会论文集》,认知科学学会,2016年,第2297-2302页。
[35] J.McCarthy,证明程序的难题,斯坦福人工智能项目备忘录16技术报告,斯坦福大学,1964年。
[36] A.Mitra和C.Baral,《学习使用公式解决简单的算术问题》,载于:计算语言学协会第54届年会会议记录,2016年,第2144-2153页。
[37] P.Quaresma,《几何定理证明器(TGTP)的数千个几何问题》,载于:《几何中的自动演绎》,P.Schreck、J.Narboux和J.Richter-Gebert主编,《计算机科学讲义》,第6877卷,施普林格,柏林-海德堡,2011年,第169-181页。doi:10.1007/978-3642-250705_10·Zbl 1350.68243号
[38] D.Raggi、A.Bundy、G.Grov和A.Pease,《离散数学(扩展版)中证明表示的自动更改》。计算机科学中的数学10(4)(2016),429-457·Zbl 1409.68261号
[39] S.Roy和D.Roth,《解决一般算术单词问题》,收录于:《2015年EMNLP会议记录:自然语言处理经验方法会议》,计算语言学协会(ACL),2015年,第1743-1752页。doi:10.18653/v1/D15-1202。
[40] S.Shi,Y.Wang,C.-Y.Lin,X.Liu和Y.Rui,通过语义分析和推理自动解决数字单词问题,收录于:EMNLP,L.Márquez,C.Callison-Burch,J.Su,D.Pighin和Y.Marton,eds,计算语言学协会,2015年,第1132-1142页,http://dblp.uni-trier。de/db/conf/emnlp/emnlp2015.html#ShiWLLR15。
[41] S.Shuppan,2014,Studyaid D.B.Chart-Shiki数据库(日语)。
[42] M.Steedman,《句法过程》。布拉德福德出版社,麻省理工学院出版社,剑桥,2001年。
[43] Strzebo´nski,A.,《使用局部投影的柱面代数分解》,《符号计算杂志》76(C)(2016),36-64。doi:10.1016/j.jsc.2015.11.18·Zbl 1350.14042号
[44] G.Sutcliffe,《TPTP问题库和相关基础设施:FOF和CNF部件》,v3.5.0,《自动推理杂志》43(4)(2009),337-362。doi:10.1007/s10817009-9143-8·Zbl 1185.68636号
[45] G.Sutcliffe、M.Stickel、S.Schulz、Urban和J.Answer,《TPTP提取》,网址:http://www.cs.miami.edu/tptp/tptp/Proposals/AnswerExtraction.html。
[46] A.Tarski,《初等代数和几何的决策方法》,加州大学出版社,伯克利,1951年·Zbl 0044.25102号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。