×

kProbLog:用于机器学习的代数Prolog。 (英语) Zbl 1457.68237号

摘要:我们引入kProbLog作为机器学习的声明性逻辑语言。kProbLog是Prolog的一个简单代数扩展,其事实和规则由半环标签注释。它允许优雅地将代数表达式与逻辑程序相结合。我们介绍了kProbeLog的语义、推理算法及其实现,并提供了收敛性保证。我们提供了几个代码示例来说明它在广泛的机器学习技术中的潜力。特别是,我们展示了最先进的图核的编码,如魏斯费勒-勒曼图核、传播核和图不变核的实例,这是一个最近的具有连续属性的图核框架。然而,kProbLog并不局限于核方法,它可以简明地表达基于张量的算法的声明性公式,如矩阵分解和基于能量的模型,并且可以利用对偶数的半环来执行算法微分。此外,实验表明,kProbLog不仅具有理论意义,而且可以应用于实际数据集。在技术层面上,kProbLog通过允许多个半环共存于一个程序中,并通过引入元函数来操作代数值,从而扩展了aProbLog(一种代数Prolog)。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68N17号 逻辑编程
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abadi,M.、Agarwal,A.、Barham,P.、Brevdo,E.、Chen,Z.、Citro,C.、Corrado,G.S.、Davis,A.、Dean,J.、Devin,M.,Ghemawat,S.、Goodfellow,I.、Harp,A.、Irving G、Isard,M.和Jia,Y.、Jozefowicz,R.、Kaiser,L.、Kudlur,M.。一、。,Talwar,K.,Tucker,P.,Vanhoucke,V.,Vasudevan,V.、Viégas,F.、Vinyals,O.、Warden,P.、Wattenberg,M.、Wicke M、Yu,Y.和Zheng,X.(2015)。TensorFlow:异构系统上的大规模机器学习。http://tensorflow.org/,软件可从tensorflow.org获得。
[2] Bastien,F.、Lamblin,P.、Pascanu,R.、Bergstra,J.、Goodfellow IJ、Bergeron,A.、Bouchard,N.和Bengio,Y.(2012年)。Theano:新功能和速度改进。深度学习和无监督特征学习NIPS 2012研讨会。
[3] Baydin,A.G.、Pearlmutter,B.A.、Radul,A.A.和Siskind,J.M.(2015)。机器学习中的自动区分:一项调查。arXiv公司:1502.05767·Zbl 06982909号
[4] Bryant,R.E.(1992)。有序二元决策图的符号布尔运算。ACM计算调查,24(3),293-318·doi:10.1145/136035.136043
[5] Ceri,S.、Gottlob,G.和Tanca,L.(1989)。关于数据日志,你一直想知道什么(但从来不敢问)。IEEE知识与数据工程汇刊,1(1),146-166。doi:10.1109/69.43410·数字对象标识代码:10.1109/69.43410
[6] Collobert,R.、Bengio,S.和Mariéthoz,J.(2002)。Torch:模块化机器学习软件库。IDIAP:技术代表。
[7] Costa,F.和De Grave,K.(2010年)。快速邻域子图成对距离核。第27届国际机器学习会议(ICML-10),6月21日至24日,以色列海法,第255-262页,http://www.icml2010.org/papers/347.pdf
[8] Darwiche,A.(2011)。SDD:命题知识库的新规范表示。2011年7月16日至22日,西班牙加泰罗尼亚巴塞罗那第22届国际人工智能联合会议记录,IJCAI,第819-826页。doi:10.5591/978-1-57735-516-8/IJCAI11-143
[9] Darwiche,A.和Marquis,P.(2002年)。知识汇编图。《人工智能研究杂志》,17(1),229-264·Zbl 1045.68131号
[10] De Marneffe,M.C.和Manning,C.D.(2008年)。stanford类型的依赖关系表示。InCooling 2008:跨框架和跨域解析器评估研讨会论文集,计算语言学协会,第1-8页·Zbl 0339.68004号
[11] De Raedt,L.(2008)。逻辑和关系学习。柏林:斯普林格·Zbl 1203.68145号 ·doi:10.1007/978-3-540-68856-3
[12] De Raedt,L.、Kimmig,A.、Toivonen,H.(2007)。Problog:一种概率prolog及其在链路发现中的应用。2007年1月6日至12日,第20届国际人工智能联合会议记录,印度海得拉巴,第2462-2467页,http://ijcai.org/Processings/07/Papers/396.pdf ·Zbl 1079.68086号
[13] De Raedt,L.、Kersting,K.、Natarajan,S.和Poole,D.(2016)。统计关系人工智能:逻辑、概率和计算。人工智能和机器学习综合讲座,10(2),1-189·Zbl 1352.68005号 ·doi:10.2200/S00692ED1V01Y201601AIM032
[14] Debnath,A.K.、Lopez de Compadre,R.L.、Debnath,G.、Shusterman,A.J.和Hansch,C.(1991)。诱变芳香族和杂芳香族硝基化合物的构效关系。与分子轨道能量和疏水性的关系。药物化学杂志,34(2),786-797·doi:10.1021/jm00106a046
[15] Droste,M.和Kuich,W.(2009年)。半环和形式幂级数。柏林:斯普林格·Zbl 1484.68082号 ·doi:10.1007/978-3642-01492-5_1
[16] Eisner,J.(2002)。概率有限状态传感器的参数估计。《计算语言学协会第40届年会论文集》,计算语言学协会,第1-8页。
[17] Eisner,J.、Blatz,J.(2007)。用于优化解析算法和其他加权逻辑程序的程序转换。《形式语法学报》,第45-85页。
[18] Eisner,J.和Filardo,N.W.(2011年)。Dyna:为现代人工智能扩展数据日志。在数据日志中重新加载。施普林格,第181-220页。
[19] Eisner,J.、Goldlust,E.和Smith,N.A.(2004年)。Dyna:一种用于实现动态程序的声明性语言。《计算语言学协会第42届年会论文集》,《伴侣卷》,巴塞罗那,第218-221页。
[20] Esparza,J.、Luttenberger,M.和Schlund,M.(2014)。Fpsolve:半环上不动点方程的通用求解器。在第19届国际会议论文集《自动机的实现和应用》中,CIAA 2014,德国吉森,7月30日至8月2日,第1-15页。doi:10.1007/978-3-319-08846-4_1·Zbl 1302.68330号
[21] Frasconi,P.、Costa,F.、De Raedt,L.和De Grave,K.(2014)。klog:一种用内核进行逻辑和关系学习的语言。人工智能,217117-143。doi:10.1016/j.artint.2014.08.003·Zbl 1405.68288号 ·doi:10.1016/j.artint.2014.08.003
[22] Garcez,Ad.、Besold,T.R.、de Raedt,L.、Földiak,P.、Hitzler,P.,Icard,T.、Kühnberger,K.U.、Lamb,L.C.、Miikkulainen,R.和Silver,D.L.(2015)。神经符号学习和推理:贡献和挑战。在斯坦福大学举行的AAAI知识表示和推理春季研讨会论文集:集成符号和神经方法。
[23] Garcez,A.S.、Lamb,L.C.和Gabbay,D.M.(2008)。神经符号认知推理。柏林:斯普林格。
[24] Gärtner,T.、Flach,P.和Wrobel,S.(2003)。关于图核:硬度结果和有效的替代品。学习理论和核心机器。施普林格,第129-143页·Zbl 1274.68312号
[25] Gärtner,T.、Lloyd,J.W.和Flach,P.A.(2004)。结构化数据的内核和距离。机器学习,57(3),205-232·Zbl 1079.68086号 ·doi:10.1023/B:MACH.0000039777.23772.30
[26] Getoor,L.和Taskar,B.(编辑)。(2007). 统计关系学习导论。自适应计算和机器学习。马萨诸塞州剑桥:麻省理工学院出版社·Zbl 1141.68054号
[27] Golub,G.H.和Van Loan,C.F.(2012年)。矩阵计算(第3卷)。巴尔的摩:JHU出版社。
[28] Green,T.J.、Karvounarakis,G.和Tannen,V.(2007年)。起源半环。在第26届ACM SIGMOD-SIGACT-SIGART数据库系统原理研讨会的会议记录中。ACM公司。
[29] Griewank,A.和Walther,A.(2008年)。评估导数:算法微分的原理和技术(第二版)。费城:工业和应用数学学会·Zbl 1159.65026号
[30] Kashima,H.、Tsuda,K.和Inokuchi,A.(2003)。标记图之间的边缘化核。ICML,第3页,第321-328页。
[31] Kazius,J.、McGuire,R.和Bursi,R.(2005)。用于致突变性预测的毒蕈的衍生和验证。药物化学杂志,48(1),312-320·Zbl 1352.68005号
[32] Kim,M.和Candan,K.S.(2011年)。张量关系代数框架内的近似张量分解。《第20届ACM信息和知识管理会议论文集》,CIKM 2011,英国格拉斯哥,10月24日至28日,第1737-1742页。doi:10.1145/2063576.2063827·兹比尔1405.68288
[33] Kimmig,A.、Van den Broeck,G.和De Raedt,L.(2011年)。推理可能世界的代数序言。《第二十五届美国人工智能学会人工智能会议论文集》,2011年8月7日至11日,美国加利福尼亚州旧金山,http://www.aaai.org/ocs/index.php/aaai/AAAI11/paper/view/3685。
[34] Kimmig,A.、Van den Broeck,G.和De Raedt,L.(2012年)。代数模型计数。CoRR abs/1211.4475,arXiv:1211.4475·Zbl 1436.68335号
[35] Kisa,D.、Van den Broeck,G.、Choi,A.和Darwiche,A.(2014)。概率句子决策图。第14届知识表示与推理原则国际会议论文集·Zbl 1390.68640号
[36] Koren,Y.、Bell,R.和Volinsky,C.(2009年)。推荐系统的矩阵分解技术。计算机,42(8),30-37。
[37] Kuich,W.(1997)。半环和形式幂级数:它们与形式语言和自动机的相关性(第609-677页)。在正式语言手册:斯普林格。
[38] Landwehr,N.、Passerini,A.、De Raedt,L.和Frasconi,P.(2006)。《学习简单关系内核》,第389-394页。
[39] Li,X.和Roth,D.(2002)。学习问题分类器。第19届国际计算语言学会议论文集——第1卷,计算语言学协会。
[40] Mahé,P.、Ueda,N.、Akutsu,T.、Perret,J.L.和Vert,J.P.(2004)。边缘化图核的扩张。《第二十一届机器学习国际会议论文集》,ACM,第70页。
[41] Milch,B.、Marthi,B.、Russell,S.J.、Sontag,D.、Ong,D.L.和Kolobov,A.(2005)。BLOG:未知对象的概率模型,第1352-1359页,http://ijcai.org/Processings/05/Papers/1546.pdf。
[42] Muggleton,S.、Raedt,L.D.、Poole,D.、Bratko,I.、Flach,P.A.、Inoue,K.等人(2012年)。ILP迎来了20个传记和未来挑战。机器学习,86(1),3-23。doi:10.1007/s10994-011-5259-2·Zbl 1243.68014号 ·doi:10.1007/s10994-011-5259-2
[43] Neumann,M.、Patricia,N.、Garnett,R.和Kersting,K.(2012年)。通过随机化实现高效的图核。《数据库中的机器学习和知识发现——欧洲会议论文集》,ECML PKDD 2012,英国布里斯托尔,9月24-28日。第一部分,第378-393页。doi:10.1007/978-3-642-33460-3_30。
[44] Nickel,M.、Tresp,V.和Kriegel,H.P.(2011年)。多关系数据集体学习的三方模型。《第28届机器学习国际会议论文集》(ICML-11),第809-816页·Zbl 1243.68014号
[45] Nilsson,U.和Maluszynski,J.(1990年)。逻辑、编程和Prolog。奇切斯特:威利·Zbl 0722.68023号
[46] Orsini,F.、Frasconi,P.和De Raedt,L.(2015)。图不变核。第二十四届国际人工智能联合会议论文集,2015年国际人工智能大会,阿根廷布宜诺斯艾利斯,7月25日至31日,第3756-3762页,http://ijcai.org/Abstract/15/528。
[47] Quinlan,J.R.(1990年)。从关系中学习逻辑定义。机器学习,5(3),239-266。
[48] Richardson,M.和Domingos,P.M.(2006)。马尔可夫逻辑网络。机器学习,62(1-2),107-136。doi:10.1007/s10994-006-5833-1·Zbl 1470.68221号 ·doi:10.1007/s10994-006-5833-1
[49] Sammut,C.(1993)。归纳逻辑编程的起源:一个史前故事。第三届归纳逻辑编程国际研讨会论文集。J Stefan Institute,第127-147页。
[50] 佐藤(1995)。具有分布语义的逻辑程序的统计学习方法。《逻辑编程》,第十二届逻辑编程国际会议记录,日本东京,6月13日至16日,第715-729页。
[51] Sato,T.和Kameya,Y.(1997年)。棱镜:一种符号统计建模语言。第十五届国际人工智能联合会议论文集,IJCAI 97,日本名古屋,8月23日至29日,第2卷,第1330-1339页。http://ijcai.org/Processings/97-2/Papers/078.pdf。
[52] Shervashidze,N.、Schweitzer,P.、van Leeuwen,E.J.、Mehlhorn,K.和Borgwardt,K.M.(2011)。魏斯费勒-勒曼图核。机器学习研究杂志12:2539-2561,http://dl.acm.org/citation.cfm?id=2078187。 ·Zbl 1280.68194号
[53] van Emden,M.H.和Kowalski,R.A.(1976年)。作为编程语言的谓词逻辑的语义。美国医学会杂志,23(4),733-742。doi:10.1145/321978.321991·Zbl 0339.68004号 ·数字对象标识代码:10.1145/321978.321991
[54] Van Laer,W.和De Raedt,L.(2001)。如何将命题学习者提升到一阶逻辑:案例研究。在机器学习及其应用中。施普林格,第102-126页·兹比尔0980.68700
[55] Vishwanathan,S.V.N.、Schraudolph,N.N.、Kondor,R.和Borgwardt,K.M.(2010)。图形内核。机器学习研究杂志,11201-1242·Zbl 1242.05112号
[56] Vlasselaer,J.、Van den Broeck,G.、Kimmig,A.、Meert,W.和De Raedt,L.(2015)。概率逻辑程序中使用tp-编译的任何时间推断。第二十四届国际人工智能联合会议论文集,2015年国际人工智能大会,阿根廷布宜诺斯艾利斯,7月25日至31日,第1852-1858页,http://ijcai.org/Abstract/15/263。 ·Zbl 1386.68174号
[57] Whaley,J.、Avots,D.、Carbin,M.和Lam,M.S.(2005年)。使用带有二进制决策图的数据日志进行程序分析。编程语言和系统:Springer·Zbl 1159.68386号 ·数字对象标识代码:10.1007/115754678
[58] Zhang,D.,&Lee,W.S.(2003)。使用支持向量机进行问题分类。2003年7月28日至8月1日,加拿大多伦多,第26届ACM SIGIR信息检索研究与开发国际年会会议记录,SIGIR 2003,第26-32页。doi:10.1145/860435.860443·Zbl 1242.05112号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。