×

概率逻辑程序的基于频带的Monte-Carlo结构学习。 (英语) Zbl 1346.68051号

概要:概率逻辑编程可用于建模实体之间具有复杂和不确定关系的领域。虽然许多作者已经考虑了学习此类程序参数的问题,但学习结构的问题仍有待深入探讨。在这项工作中,我们提出了一种基于单人游戏方法的近似搜索方法,称为雷穆尔它将概率逻辑程序结构的学习问题视为一个多臂盗贼问题,依赖于蒙特卡罗树搜索UCT算法,该算法将树搜索的精度与随机抽样的通用性相结合。雷穆尔通过修改UCT算法,其工作方式类似于保险丝,它考虑一个有限的未知视界,并处理具有巨大分支因子的问题。该系统已经在各种现实数据集上进行了测试,与其他最先进的统计关系学习方法相比,在以下方面表现出了良好的性能分类能力。

MSC公司:

68N17号 逻辑编程
68T05型 人工智能中的学习和自适应系统
90立方厘米 马尔可夫和半马尔可夫决策过程
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Auer,P.、Cesa-Bianchi,N.和Fischer,P.(2002)。多武器土匪问题的有限时间分析。机器学习,47(2-3),235-256·Zbl 1012.68093号 ·doi:10.1023/A:1013689704352
[2] Beerenwinkel,N.、Rahnenführer,J.、Däumer,M.、Hoffmann,D.、Kaiser,R.、Selbig,J.等人(2005年)。从横截面数据中学习多种进化路径。计算生物学杂志,12584-598·doi:10.1089/cmb.2005.12.584
[3] Bellodi,E.和Riguzzi,F.(2012年)。学习概率逻辑程序的结构。收录:S.Muggleton、A.Tamaddoni-Nezhad、F.Lisi(编辑)。归纳逻辑编程,LNCS,第7207卷(第61-75页)。施普林格,柏林,海德堡·Zbl 1379.68269号
[4] Bellodi,E.和Riguzzi,F.(2013)。概率逻辑程序二进制决策图上的期望最大化。智能数据分析,17(2),343-363。
[5] Bellodi,E.和Riguzzi,F.(2014)。通过搜索子句空间实现概率逻辑程序的结构学习。逻辑编程理论与实践FirstView文章。doi:10.1017/S1471068413000689·Zbl 1379.68269号
[6] Bollig,B.和Wegener,I.(1996年)。改进OBDD的变量顺序是NP完成的。IEEE计算机汇刊,45(9),993-1002·Zbl 1048.68571号 ·数字对象标识代码:10.1109/12.537122
[7] Browne,C.、Powley,E.J.、Whitehouse,D.、Lucas,S.M.、Cowling,P.I.、Rohlfshagen,P.等人(2012年)。蒙特卡罗树搜索方法综述。IEEE游戏中计算智能和AI汇刊,4(1),1-43·doi:10.1109/TCIAIG.2012.2186810
[8] Bubeck,S.和Cesa-Bianchi,N.(2012年)。随机和非随机多武器盗贼问题的遗憾分析。机器学习的基础和趋势,5(1),1-122·Zbl 1281.91051号 ·doi:10.1561/220000024
[9] Darwiche,A.和Marquis,P.(2002年)。知识汇编图。《人工智能研究杂志》,17,229-264·Zbl 1045.68131号
[10] Davis,J.和Goadrich,M.(2006)。Precision-Recall和ROC曲线之间的关系。摘自:第23届国际会议(ICML-2006)机器学习会议记录,ACM(第233-240页)。
[11] De Raedt,L.、Kimmig,A.和Toivonen,H.(2007)。ProbLog:一种概率Prolog及其在链路发现中的应用。摘自:国际人工智能联合会议(第2462-2467页)。AAAI出版社·Zbl 1189.03039号
[12] De Raedt,L.、Demoen,B.、Fierens,D.、Gutmann,B.、Janssens,G.和Kimmig,A.(2008a)。朝向消化统计关系学习的字母组。In:NIPS*2008概率规划研讨会。
[13] De Raedt,L.、Kersting,K.、Kimmig,A.、Revoredo,K.和Toivonen,H.(2008b)。压缩概率Prolog程序。机器学习,70(2-3),151-168·Zbl 1470.68097号 ·数字对象标识代码:10.1007/s10994-007-5030-x
[14] Dean,J.和Ghemawat,S.(2008年)。Mapreduce:简化大型集群上的数据处理。ACM的通信,51(1),107-113。doi:10.145/1327452.1327492·数字对象标识代码:10.1145/1227452.1327492
[15] Duboc,A.、Paes,A.和Zaverucha,G.(2009年)。在fol理论修正中使用底部子句和模式声明。机器学习,76(1),73-107。doi:10.1007/s10994-009-5116-8·Zbl 1470.68218号 ·doi:10.1007/s10994-009-5116-8
[16] Fawcett,T.(2006)。ROC分析简介。模式识别信件,27861-874·Zbl 1106.74031号 ·doi:10.1016/j.patrec.2005.10.010
[17] Fierens,D.、den Broeck,G.V.、Renkens,J.、Shterionov,D.S.、Gutmann,B.和Thon,I.等人(2013年)。概率逻辑程序中使用加权布尔公式的推理和学习。In:逻辑编程理论与实践firstview文章(CoRR abs/1304.6810)·Zbl 1379.68062号
[18] Friedman,N.(1998年)。贝叶斯结构EM算法。摘自:第14届人工智能不确定性会议记录(第129-138页)。摩根·考夫曼。
[19] Gaudel,R.和Sebag,M.(2010年)。功能选择作为一个单人游戏。摘自:第27届机器学习国际会议记录(第359-366页)·Zbl 0379.62005年
[20] Gelly,S.和Silver,D.(2007年)。结合UCT中的在线和离线知识。摘自:第24届机器学习国际会议记录(第273-280页)。ACM公司。
[21] Gelly,S.和Wang,Y.(2006年)。围棋中的勘探开发:蒙特卡洛围棋的UCT。在:NIPS勘探开发在线交易研讨会。
[22] Grumberg,O.、Livne,S.和Markovitch,S.(2003)。学习在验证中排序BDD变量。《人工智能研究杂志》,18,83-116·Zbl 1045.68092号
[23] Gutmann,B.、Thon,I.和De Raedt,L.(2011年)。从解释中学习概率逻辑程序的参数。收录人:D.Gunopulos、T.Hofmann、D.Malerba、M.Vazirgiannis(编辑)。欧洲数据库机器学习和知识发现会议,LNCS,第6911卷(第581-596页)。斯普林格·Zbl 1045.68092号
[24] Hoos,H.H.和Stützle,T.(2004)。随机局部搜索:基础与应用。阿姆斯特丹:爱思唯尔。
[25] Huynh,T.N.和Mooney,R.J.(2008年)。马尔可夫逻辑网络的判别结构和参数学习。收录人:W.W.Cohen,A.McCallum,S.T.Roweis(编辑)。第25届机器学习国际会议记录(第416-423页)。ACM公司。
[26] Kersting,K.和De Raedt,L.(2008)。学习贝叶斯逻辑程序的基本原则。In:概率归纳逻辑编程,LNCS,第4911卷(189-221)。斯普林格·Zbl 1137.68544号
[27] Khosravi,H.、Schulte,O.、Hu,J.和Gao,T.(2012)。用决策树学习紧马尔可夫逻辑网络。机器学习,89(3),257-277·doi:10.1007/s10994-012-5307-6
[28] Khot,T.、Natarajan,S.、Kersting,K.和Shavlik,J.W.(2011年)。通过函数梯度提升学习马尔可夫逻辑网络。收件人:Cook DJ,Pei J,W.W.0010,O.R.Zaane,X.Wu(编辑)。第11届IEEE数据挖掘国际会议记录(第320-329页)。
[29] Kocsis,L.和Szepesvári,C.(2006)。基于Bandit的Monte-Carlo规划。摘自:第17届欧洲机器学习会议记录(第282-293页)。斯普林格。
[30] Kocsis,L.、Szepesvári,C.和Willemson,J.(2006)。改进了Monte-Carlo搜索。爱沙尼亚塔尔图大学技术代表。
[31] Kok,S.和Domingos,P.(2005)。学习马尔可夫逻辑网络的结构。摘自:第22届机器学习国际会议记录(第441-448页)。ACM公司。
[32] Kok,S.和Domingos,P.(2010年)。使用结构模体学习马尔可夫逻辑网络。收录人:J.Fürnkranz,T.Joachims(编辑)。第27届机器学习国际会议记录(第551-558页)。全能女。
[33] Lowd,D.和Domingos,P.(2007年)。马尔可夫逻辑网络的有效权值学习。摘自:第十一届欧洲数据库知识发现原则与实践会议记录(第200-211页)。斯普林格。
[34] Martí,R.、Moreno,J.M.和Duarte,A.(2010年)。高级多部分方法。柏林:斯普林格。 ·doi:10.1007/978-1-4419-1665-59
[35] May,W.(1999)。信息提取与整合:全球案例研究。弗赖堡大学信息研究所技术代表。
[36] Meert,W.、Struyf,J.和Blockeel,H.(2008年)。利用贝叶斯网络学习技术学习基础CP-Logic理论。信息基础,89(1),131-160·Zbl 1155.68493号
[37] Mihalkova,L.和Mooney,R.J.(2007)。马尔可夫逻辑网络结构的自底向上学习。摘自:第24届机器学习国际会议记录(第625-632页)。ACM公司。
[38] Muggleton,S.(1995年)。逆蕴涵和程序。新一代计算,13,245-286·doi:10.1007/BF03037227
[39] Natarajan,S.、Khot,T.、Kersting,K.、Gutmann,B.和Shavlik,J.(2012)。统计关系学习中基于梯度的助推:关系依赖网络案例。机器学习,86(1),25-56·Zbl 1243.68245号 ·doi:10.1007/s10994-011-5244-9
[40] Nienhuys-Cheng,S.H.和de Wolf,R.(1997)。归纳逻辑程序设计基础。柏林:斯普林格·Zbl 1293.68014号 ·doi:10.1007/3-540-62927-0
[41] Paes,A.、Revoredo,K.、Zaverucha,G.和Costa,V.S.(2005)。从实例中修正概率一阶理论。摘自:《第十五届归纳逻辑编程国际会议论文集》,LNCS,第3625卷(第295-311页)。斯普林格。doi:10.1007/11536314_18·Zbl 1134.68550号
[42] Paes,A.、Zaverucha,G.和Costa,V.S.(2008)。通过随机局部搜索从示例中修改一阶逻辑理论。摘自:第17届归纳逻辑编程国际会议论文集,ILP’07(第200-210页)。施普林格,柏林,海德堡。http://dl.acm.org/ticitation.cfm?id=1793494.1793518 ·Zbl 1136.68500号
[43] 普尔,D。;Raedt,L.(编辑);Frasconi,P.(编辑);Kersting,K.(编辑);Muggleton,S.(编辑),《独立选择逻辑及其超越》,第4911、222-243号(2008),柏林,海德堡·Zbl 1137.68596号 ·doi:10.1007/978-3-540-78652-88
[44] Rauzy,A.、Chátelet,E.、Dutuit,Y.和Bérenguer,C.(2003)。评估产品总和的方法的实际比较。可靠性工程与系统安全,79(1),33-42·doi:10.1016/S0951-8320(02)00165-5
[45] Richards,B.L.和Mooney,R.J.(1995)。自动细化一阶角主词域理论。机器学习,19(2),95-131。doi:10.1007/BF01007461·doi:10.1007/BF01007461
[46] Riguzzi,F.(2004)。学习带注释析取的逻辑程序。收录:A.Srinivasan,R.King(编辑)。第14届归纳逻辑编程国际会议记录,LNCS,第3194卷(第270-287页)。斯普林格。doi:10.1007/978-3-540-30109-7_21·Zbl 1105.68394号
[47] Riguzzi,F.(2007a)。ALLPAD:带注释析取的逻辑程序的近似学习。收录:S.Muggleton,R.Otero(编辑)。第16届归纳逻辑编程国际会议论文集,LNAI,第4455卷(第43-45页)。斯普林格。doi:10.1007/978-3-540-73847-3_11·Zbl 1470.68163号
[48] Riguzzi,F.(2007b)。LPAD和CPlogic的自顶向下解释器。参见:《意大利人工智能协会第十届大会记录》,LNAI,第4733卷(第109-120页)。斯普林格。doi:10.1007/978-3-540-74782-6_11。
[49] Riguzzi,F.(2008年)。ALLPAD:带注释析取的逻辑程序的近似学习。机器学习,70(2-3),207-223。doi:10.1007/s10994-007-5032-8·Zbl 1470.68163号 ·doi:10.1007/s10994-007-5032-8
[50] Riguzzi,F.(2009年)。独立选择逻辑的扩展语义和推理。IGPL逻辑杂志,17(6),589-629。doi:10.1093/jigpal/jzp025·Zbl 1189.03039号 ·doi:10.1093/jigpal/jzp025
[51] Riguzzi,F.(2014)。加速概率逻辑程序的推理。《计算机杂志》,57(3),347-363。doi:10.1093/comjnl/bxt096·doi:10.1093/comjnl/bxt096
[52] Riguzzi,F.和Di Mauro,N.(2012年)。将信息瓶颈应用于统计关系学习。机器学习,86(1),89-114。doi:10.1007/s10994-011-5247-6·Zbl 1243.68247号 ·doi:10.1007/s10994-011-5247-6
[53] Riguzzi,F.和Swift,T.(2010年)。带注释析取的逻辑程序上推理的制表和答案抽取。In:第26届国际会议技术交流。逻辑编程会议(ICLP’10),Schloss Dagstuhl-Leibniz-Zentrum fuer Informatik,莱布尼茨国际信息学会议(LIPIcs),第7卷(第162-171页)。doi:10.4230/LIPIcs。ICLP.2010.162·兹比尔1237.68049
[54] Riguzzi,F.和Swift,T.(2011年)。PITA系统:不确定性推理的表格和答案包容。2011年7月6日至10日,肯塔基州列克星敦,第27届国际逻辑编程会议(ICLP’11)专刊,《逻辑编程理论与实践》11(4-5),433-449。doi:10.1017/S14710684110010X·Zbl 1218.68169号
[55] Riguzzi,F.和Swift,T.(2013年)。分布语义下概率逻辑规划的良好定义和有效推理。摘自:逻辑编程理论与实践13(第02-25期GULP年会特刊)(第279-302页)。doi:10.1017/S1471068411000664·Zbl 1267.68084号
[56] Robbins,H.(1952年)。序贯设计实验的一些方面。美国数学学会公报,58527-535·Zbl 0049.37009号 ·doi:10.1090/S0002-9904-1952-09620-8
[57] 罗莱特,P。;塞巴格,M。;Teytaud,O。;Buntine,W.(编辑);Grobelnik,M.(编辑);Mladeni,D.(编辑);Shawe-Taylor,J.(编辑),《将主动学习推进到最佳状态:一种易于驾驭的蒙特卡洛,基于台球的算法》,第5782、302-317号(2009),柏林,海德堡·doi:10.1007/978-3642-04174-7_20
[58] Rujan,P.(1997)。在版本空间中玩台球。神经计算,9(1),99-122·Zbl 1076.68554号 ·doi:10.1162/neco.1997.9.1.99
[59] 桑·T。;Beame,P。;堪萨斯州考茨;Veloso,MM(编辑);Kambhampati,S.(编辑),通过加权模型计数进行贝叶斯推理,475-482(2005),剑桥
[60] Santos Costa,V.、Rocha,R.和Damas,L.(2012)。YAP Prolog系统。逻辑程序设计理论与实践,12(1-2),5-34·Zbl 1244.68017号 ·doi:10.1017/S1471068411000512
[61] 佐藤(1995)。具有分布语义的逻辑程序的统计学习方法。摘自:逻辑编程国际会议(第715-729页)。麻省理工学院出版社。
[62] 佐藤(2008)。PRISM符号统计建模一瞥。《智能信息系统杂志》,31(2),161-176·doi:10.1007/s10844-008-0062-7
[63] Sato,T.和Kameya,Y.(2001年)。符号统计建模逻辑程序的参数学习。《人工智能研究杂志》,第15期,第391-454页·Zbl 0994.68025号
[64] Schulte,O.和Khosravi,H.(2012)。通过格搜索学习关系数据的图形模型。机器学习,88(3),331-368·文件编号:10.1007/s10994-012-5289-4
[65] Schwarz,G.(1978年)。估算模型的维度。《统计年鉴》,6(2),461-464·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[66] Srinivasan,A.(2012年)。阿勒夫。http://www.cs.ox.ac.uk/activities/machlearn/Aleph/Aleph.html。
[67] Srinivasan,A.、Muggleton,S.、Sternberg,M.J.E.和King,R.D.(1996)。致突变性理论:一级和基于特征的诱导研究。AI,85(1-2),277-299。
[68] Srinivasan,A.、King,R.D.、Muggleton,S.和Sternberg,M.J.E.(1997)。使用ILP预测致癌。N.Lavrac&S.Dzeroski(编辑),第七届归纳逻辑编程国际研讨会,LNCS(第273-287页)。斯普林格。
[69] Vennekens,J.、Verbaeten,S.和Bruynooghe,M.(2004)。带注释析取的逻辑程序。逻辑编程国际会议,LNCS,第3131卷(第195-209页)。斯普林格·Zbl 1104.68391号
[70] Zhi elezní,F.、Srinivasan,A.和Page,C.D.(2002)。格搜索运行时分发可能是重跟踪的。摘自:第十二届归纳逻辑编程国际会议论文集,施普林格·Zbl 1017.68537号
[71] Zelezní,F.、Srinivasan,A.和Page,C.D,Jr.(2006)。在ILP中随机重新启动搜索。机器学习,64(1-3),183-208·Zbl 1103.68484号 ·doi:10.1007/s10994-006-7733-9
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。