×

通过搜索子句空间实现概率逻辑程序的结构学习。 (英语) Zbl 1379.68269号

摘要:学习概率逻辑编程语言正受到越来越多的关注,可以使用系统学习这些语言的参数(PRISM、LeProbLog、LFI-ProbLog和EMBLEM)或结构和参数(SEM-CP逻辑和SLIPCASE)。本文提出了用于“通过搜索子句空间来学习概率逻辑程序的结构”的SLIPCOVER算法。它在概率子句空间中执行波束搜索,在理论空间中使用数据的对数似然作为指导启发式进行贪婪搜索。为了估计对数似然,SLIPCOVER使用EMBLEM执行期望最大化。该算法在五个真实数据集上进行了测试,并与SLIPCASE、SEM-CP逻辑、Aleph和两种马尔可夫逻辑网络学习算法(使用结构模式(LSM)和Aleph++ExactL1学习)进行了比较。在大多数情况下,SLIPCOVER在精确重新调用和接收器操作特性曲线下获得更高的区域。

MSC公司:

68T05年 人工智能中的学习和自适应系统
68N17号 逻辑编程
68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
68层37 人工智能背景下的不确定性推理
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 比伦文克尔。,RahnenführerJ.、DäumerM.、Hoffmann D.、。,凯撒,塞尔比格J。和LengauerT.2005。从横截面数据中学习多种进化路径。计算生物学杂志12,584-598.10.1089/cmb.2005.12.58416108705·doi:10.1089/cmb.2005.12.584
[2] 贝洛迪。和Riguzzi F.2011。学习概率逻辑程序的结构。在第21届国际归纳逻辑编程会议(ILP-2011)上,修订了论文集。LNCS,第7207卷。德国柏林施普林格,61-75。
[3] 贝洛迪。和Riguzzi F.2012。概率逻辑程序的期望最大化算法的实验。人工智能8,3-18。
[4] 贝洛迪。和Riguzzi F.2013。概率逻辑程序二进制决策图上的期望最大化。智能数据分析17,343-363。
[5] 贝卡普。,劳赫J。和TsumotoS。(编辑)2002年。ECML/PKDD 2002发现挑战。ECML/PKDD发现挑战会议录:数据库知识发现的合作努力,108-119。
[6] 比巴姆。,费利利斯。和EspositoF.2008。马尔可夫逻辑网络的判别结构学习。在第18届国际归纳逻辑编程会议(ILP-2008)的会议记录中。LNCS,第5194卷。德国柏林施普林格,59-76·Zbl 1156.68520号
[7] 博伊德克。,Davis J。,第D页。和Santos CostaV.2012。精确调用空间中的不可达区域及其对经验评估的影响。在《第29届国际机器学习大会论文集》(ICML-2012)上,英国苏格兰爱丁堡。ICML.cc/Omnipress,威斯康星州麦迪逊,639-646。
[8] 布拉加利亚斯。和Riguzzi F.2011。带注释析取的逻辑程序的近似推理。在第20届国际归纳逻辑编程会议(ILP-2010)上,修订论文。LNCS,第6489卷。德国柏林施普林格,30-37·Zbl 1329.68208号
[9] 克雷文。和SlatteryS.2001。具有统计谓词发明的关系学习:超文本的更好模型。机器学习43,97-119.10.1023/A:1007676901476·Zbl 0988.68818号 ·doi:10.1023/A:1007676901476
[10] 丹钦,1991年。概率逻辑程序及其语义。俄罗斯逻辑程序设计会议(RCLP-1991)。LNCS,第592卷。德国柏林施普林格,152-164。
[11] DarwicheA.2004年。将CNF编译成可分解否定范式的新进展。第16届欧洲人工智能会议论文集(ECAI-2004)。荷兰阿姆斯特丹IOS出版社,328-332。
[12] 戴维斯J。和GoadrichM.2006。精密度召回与ROC曲线之间的关系。第23届国际机器学习会议(ICML-2006)论文集。ACM国际会议记录系列148。ACM,纽约州纽约市,233-240。
[13] De RaedtL.公司。,德梅森B。,FierensD公司。,古特曼B。,杨森集团。,Kimmig公司。,LandwehrN.、MantadelisT.、。,MeertW公司。,罗查尔。,桑托斯·科斯塔。,ThonI公司。和VennekensJ.2008。朝向消化统计关系学习的字母组。在加拿大不列颠哥伦比亚省温哥华举行的概率编程:通用语言、系统和应用(NIPS 2008)第一次研讨会上,1-3。
[14] De RaedtL.公司。,科斯廷K。,Kimmig公司。,RevoredoK。和Toivonen H.2008。压缩概率Prolog程序。机器学习70,151-168.10.1007/s10994-007-5030-x·Zbl 1470.68097号 ·数字对象标识代码:10.1007/s10994-007-5030-x
[15] De RaedtL.公司。,Kimmig公司。和Toivonen H.2007。ProbLog:一种概率prolog及其在链路发现中的应用。《第20届国际人工智能联合会议论文集》(IJCAI-2007)。AAAI Press,Menlo Park,CA,2462-2467。
[16] De RaedtL公司。和2010年12月。概率规则学习。在第20届国际归纳逻辑编程会议(ILP-2010)上,修订论文,LNCS,第7207卷。施普林格,纽约州纽约市,47-58·Zbl 1329.68212号
[17] 福塞特T.2006。ROC分析简介。模式识别信函27,861-874.10.1016/j.patrec.2005.10.010·doi:10.1016/j.patrec.2005.10.010
[18] 弗里德曼,1998年。贝叶斯结构EM算法。《第14届人工智能不确定性会议论文集》(UAI'98)。摩根·考夫曼,马萨诸塞州伯灵顿,129-138。
[19] FuhrN.2000年。概率数据日志:为高级应用程序实现逻辑信息检索。美国信息科学学会杂志51,95-110.10.1002/(SICI)1097-4571(2000)51:2<95::AID-ASI2>3.0.CO;2-H型·doi:10.1002/(SICI)1097-4571(2000)51:2<95::AID-ASI2>3.0.CO;2-H型
[20] GetoorL.、FriedmanN.、。,KollerD公司。,PfefferA公司。和TaskarB.2007。概率关系模型。在《统计关系学习导论》中,L.Getoor和B.Taskar,麻省理工学院出版社编辑,马萨诸塞州剑桥,129-174。
[21] 古特曼B。,Kimmig公司。,科斯廷K。和De RaedtL.2008。概率数据库中的参数学习:最小二乘法。在数据库中的机器学习和知识发现-欧洲会议(ECML/PKDD-2008),论文集,第一部分,LNCS,第5211卷。德国柏林施普林格,473-488。
[22] 古特曼B。,Kimmig公司。,科斯廷K。和De RaedtL.2010。通过注释查询在ProbLog中进行参数估计。技术代表CW 583,比利时鲁汶大学。
[23] 古特曼B。,ThonI公司。和De RaedtL.2011。从解释中学习概率逻辑程序的参数。在数据库中的机器学习和知识发现-欧洲会议(ECML/PKDD-2011),论文集,第一部分,LNCS,第6911卷。德国柏林施普林格,581-596。
[24] HuynhT公司。N.和MooneyR。2008年期刊。马尔可夫逻辑网络的判别结构和参数学习。第25届国际机器学习会议(ICML-2008)论文集,ACM国际会议论文集307。ACM,纽约州纽约市,416-423。
[25] InoueK。,周六。,IshihataM.、。,卡梅亚。和NabeshimaH.2009。在BDD上使用EM算法评估诱因假设。《第21届国际人工智能联合会议论文集》(IJCAI-2009)。摩根·考夫曼,马萨诸塞州伯灵顿,810-815。
[26] IshihataM.、。,KameyaY。,佐藤。和MinatoS.2008a。通过BDD提出EM算法。在第18届归纳逻辑编程国际会议(ILP-2008)上,《最新突破性论文》,44-49。
[27] IshihataM.、。,卡梅亚。,佐藤。和MinatoS.2008b。通过BDD提出EM算法。技术代表TR08-0004,日本东京理工大学计算机科学系。
[28] IshihataM.、。,佐藤。和ichi MinatoS.2011。基于共享BDD编译贝叶斯网络用于参数学习。第24届澳大利亚人工智能进展联合会议(AI 2011)会议记录。LNCS,第7106卷。施普林格,纽约州纽约市,203-212。
[29] 科斯廷K。和De RaedtL.2008。学习贝叶斯逻辑程序的基本原则。在概率归纳逻辑编程中,L.De Raedt、P.Frasconi、K.Kersting和S.Muggleton,编辑LNCS,第4911卷。纽约州纽约州施普林格市,189-221.1007/978-3-540-78652-8·兹比尔1132.68007 ·doi:10.1007/978-3-540-78652-8
[30] 科斯拉维。,舒尔特奥。,胡J。和2012年高铁。用决策树学习紧马尔可夫逻辑网络。机器学习89,257-277.1007/s10994-012-5307-6·doi:10.1007/s10994-012-5307-6
[31] Kimmig公司。,德梅森B。,De RaedtL.公司。,桑托斯·科斯塔。和RochaR.2011。概率逻辑程序设计语言ProbLog的实现。逻辑程序设计的理论与实践11,235-262.10.1017/S1471068410000566·兹比尔1220.68037 ·文件编号:10.1017/S1471068410000566
[32] 科克斯。和Domingos P.2005。学习马尔可夫逻辑网络的结构。第22届国际机器学习会议(ICML-2005)论文集,ACM国际会议论文集119。ACM,纽约州纽约市,441-448。
[33] 科克斯。和DomingosP.2009。通过超图提升学习马尔可夫逻辑网络结构。在第26届国际机器学习年会(ICML-2009)的会议记录中,ACM国际会议记录系列382。ACM,纽约州纽约市,505-512。
[34] 科克斯。和DomingosP.2010。使用结构模体学习马尔可夫逻辑网络。第27届国际机器学习会议(ICML-2010)论文集。威斯康星州麦迪逊市Omnipress,邮编:551-558。
[35] 低D。和DomingosP.2007。马尔可夫逻辑网络的有效权值学习。《第18届欧洲机器学习会议论文集》(ECML-2007),LNCS,第4702卷。斯普林格,纽约州纽约市,200-211。
[36] MeertW公司。,斯特鲁伊夫J。和BlockeelH.2008。利用贝叶斯网络学习技术学习基础CP-Logic理论。基础信息89,131-160·Zbl 1155.68493号
[37] 米哈尔科娃。和穆尼。2007年期刊。马尔可夫逻辑网络结构的自底向上学习。第24届国际机器学习会议(ICML-2007)论文集,ACM国际会议论文集227。ACM,纽约州纽约市,邮编:625-632。
[38] 米纳托斯。,佐藤克。和SatoT.2007。基于零抑制BDD的符号概率计算编译贝叶斯网络。《第20届国际人工智能联合会议论文集》(IJCAI-2007)。AAAI出版社,加利福尼亚州帕洛阿尔托,2550-2555。
[39] 麻瓜顿S.1995。逆蕴涵和程序。新一代计算13,245-286.10.10007/BF03037227·doi:10.1007/BF03037227
[40] 我们的D。和穆尼。1994年期刊。结合分析和实证方法的理论完善。人工智能66,273-309.10.1016/0004-3702(94)90028-0·Zbl 0807.68089号 ·doi:10.1016/0004-3702(94)90028-0
[41] 宾夕法尼亚州。,雷沃雷多克。,ZaveruchaG公司。和Santos CostaV.2006。PFORTE:修正概率FOL理论。人工智能进展——第二届国际联合会议论文集,第十届伊比利亚-美国人工智能会议,第十八届巴西人工智能研讨会(IBERAMIA-SBIA-2006),LNCS,第4140卷。斯普林格,纽约州纽约市,441-450。
[42] 池D.1993。逻辑编程、外推和概率——一种自顶向下的任意时间算法,用于估计先验概率和后验概率。新一代计算11,377-400.10.1007/BF03037184·Zbl 0788.68025号 ·doi:10.1007/BF003037184
[43] 池D.1997。在不确定性下建模多个代理的独立选择逻辑。人工智能94,7-56.10.1016/S0004-3702(97)00027-1·Zbl 0902.03017号 ·doi:10.1016/S0004-3702(97)00027-1
[44] PrzymusinskiT公司。C.1989年。每个逻辑程序都有一个自然分层和一个迭代的最小不动点模型。第八届ACM SIGACT-SIGMOD-SIGART数据库系统原理研讨会论文集(PODS-1989)。ACM出版社,纽约州纽约市,11-21。
[45] 昆兰J。R.和Cameron-JonesR。M.1993年。FOIL:期中报告。机器学习:ECML-93,欧洲机器学习会议论文集。LNCS,第667卷。施普林格,柏林,德国,3-20。
[46] RauzyA。,中国电信公司。,尽职调查。和贝伦格,2003年。评估产品总和的方法的实际比较。可靠性工程与系统安全79,33-42.10.1016/S0951-8320(02)00165-5·doi:10.1016/S0951-8320(02)00165-5
[47] 理查兹B。L.和MooneyR。J.1995年。一阶Horn-子句域理论的自动精化。机器学习19,95-131。
[48] 理查森。和DomingosP.2006。马尔可夫逻辑网络。机器学习62,107-136.10.1007/s10994-006-5833-1·Zbl 1470.68221号 ·doi:10.1007/s10994-006-5833-1
[49] 里古兹F.2004。学习带注释析取的逻辑程序。第14届归纳逻辑程序设计国际会议论文集(ILP-2004)。LNAI,第3194卷。施普林格·弗拉格,德国柏林,270-287·兹比尔1105.68394
[50] 里古兹F.2006。ALLPAD:带注释析取的逻辑程序的近似学习。在第16届国际归纳逻辑编程会议(ILP-2006)上,修订论文集,LNCS,第4455卷。德国柏林施普林格,43-45。
[51] 里古兹F.2007。LPAD和CP-Logic的自顶向下解释器。在AI*IA 2007:人工智能和面向人类的计算中,《意大利人工智能协会第十届大会论文集》,LNCS,第4733卷。德国柏林施普林格,109-120。
[52] 里古兹F.2008a。ALLPAD:带注释析取的逻辑程序的近似学习。机器学习70,207-223.10.1007/s10994-007-5032-8·Zbl 1470.68163号 ·doi:10.1007/s10994-007-5032-8
[53] 里古兹F.2008b。基于良好语义的带注释析取的逻辑程序推理。《第24届逻辑程序设计国际会议论文集》(ICLP-2008),LNCS,第5366卷。施普林格,德国柏林,667-771·Zbl 1185.68178号
[54] 里古兹F.2009。独立选择逻辑的扩展语义和推理。IGPL17逻辑期刊,589-629.10.1093/jigpal/jzp025·Zbl 1189.03039号 ·doi:10.1093/jigpal/jzp025
[55] 里古兹F.2010。带注释析取的逻辑程序推理的SLGAD解析。基础信息102,429-466·Zbl 1220.68040号
[56] 里古兹F.2013a。MCINTYRE:用于概率逻辑编程的蒙特卡罗系统。《基础信息》124,521-541。
[57] 里古兹F.2013b。加速概率逻辑程序的推理。《计算机杂志》。doi:10.1093/comjnl/bxt096·doi:10.1093/comjnl/bxt096
[58] 里古兹。和Di MauroN.2012。将信息瓶颈应用于统计关系学习。机器学习86,89-114.10.1007/s10094-011-5247-6·Zbl 1243.68247号 ·doi:10.1007/s10994-011-5247-6
[59] 里古兹。和SwiftT.2010。带注释析取的逻辑程序推理的表格和答案包含。在第26届国际逻辑程序设计会议(ICLP-2010)的技术通信中,LIPIcs,第7卷。德国瓦登Dagstuhl-Leibniz-Zentrum fuer Informatik宫,162-171年·Zbl 1237.68049号
[60] 里古兹。和SwiftT.2011。PITA系统:不确定性推理的表格和答案包容。逻辑程序设计理论与实践,国际逻辑程序设计会议(ICLP)专刊11,433-449·Zbl 1218.68169号
[61] 里古兹。和SwiftT.2013。分布语义下概率逻辑规划的良好定义和有效推理。逻辑程序设计的理论与实践13279-302.10.1017/S1471068411000664·兹比尔1267.68084 ·doi:10.1017/S1471068411000664
[62] 桑特。,横梁P。和KautzH。2005年。通过加权模型计数进行贝叶斯推理。在第20届全国人工智能会议和第17届人工智能创新应用会议(AAAI-2005)的会议记录中。AAAI出版社/麻省理工学院出版社,马萨诸塞州剑桥,475-482。
[63] 桑托斯·科斯塔。,达马斯。和RochaR.2012。YAP Prolog系统。逻辑程序设计的理论与实践12,5-34.10.1017/S1471068411000512·Zbl 1244.68017号 ·doi:10.1017/S1471068411000512
[64] 桑托斯·科斯塔。,第D页。,卡齐姆。和CussensJ.2003。CLP(BN):概率知识的约束逻辑编程。《第19届人工智能不确定性会议论文集》(UAI'03)。摩根·考夫曼,马萨诸塞州伯灵顿,517-524。
[65] 1995年星期六。具有分布语义的逻辑程序的统计学习方法。《第十二届逻辑程序设计国际会议论文集》(ICLP-1995)。麻省理工学院出版社,马萨诸塞州剑桥,715-729。
[66] 佐藤。和KameyaY.2001。符号统计建模逻辑程序的参数学习。《人工智能研究杂志》15,391-454·Zbl 0994.68025号
[67] 施瓦兹G.1978。估算模型的维度。统计年鉴6,461-464.10.1214/aos/1176344136·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[68] 斯里尼瓦桑A.2012。Aleph[在线]。2012年4月3日查阅。网址:http://www.cs.ox.ac.uk/activities/machlearn/Aleph/Aleph.html。
[69] 斯里尼瓦桑。,麻瓜。,国王。和SternbergM.1994。诱变:非确定生物领域的ILP实验。第四届归纳逻辑编程国际研讨会论文集,GMD-Studien 237。Gesellschaft fur Mathematik und Datenverabeitung MBH,217-232。
[70] 斯里尼瓦桑。,麻瓜。,SternbergM.J.E.和KingR。D.1996年。致突变性理论:一级和基于特征的诱导研究。人工智能85,277-299.10.1016/0004-3702(95)00122-0·doi:10.1016/0004-3702(95)00122-0
[71] 泰国。,戴维姆。和德尚。P.1978年。多值决策算法的优化。第八届多值逻辑国际研讨会论文集(MLV’78)。IEEE计算机学会出版社,华盛顿特区,171-178·Zbl 0444.9011号
[72] ThonI.、。,LandwehrN.和De RaedtL.2008。关系状态描述序列的一个简单模型。《欧洲数据库机器学习和知识发现会议记录》(ECML/PKDD-2008),第二部分,LNCS第5212卷。施普林格,纽约州纽约市,506-521。
[73] 范·盖尔德拉。,罗斯克。A.和SchlipfJ。S.1991年。通用逻辑程序的基础良好的语义。ACM38杂志,620-650·Zbl 0799.68045号
[74] 维尼肯斯J。,DeneckerM.和BruynoogheM.2009年。CP-logic:一种因果概率事件及其与逻辑编程的关系的语言。逻辑程序设计的理论与实践9245-308.10.1017/S1471068409003767·Zbl 1179.68025号 ·doi:10.1017/S1471068409003767
[75] 维尼肯斯J。和VerbaetenS.2003。带注释析取的逻辑程序。技术代表CW386,KU Leuven,荷兰·Zbl 1104.68391号
[76] VennekensJ。,动词S。和BruynoogheM.2004。带注释析取的逻辑程序。在第20届逻辑编程国际会议论文集(ICLP-2004)。LNCS第3131卷。195-209年,德国柏林施普林格·Zbl 1104.68390号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。