马修·理查森;佩德罗·多明戈斯 马尔可夫逻辑网络。 (英语) Zbl 1470.68221号 机器。学习。 62,编号1-2,107-136(2006). 摘要:我们提出了一种简单的方法,将一阶逻辑和概率图形模型组合在一个表示中。马尔可夫逻辑网络(MLN)是一个一阶知识库,每个公式(或子句)都有一个权重。与表示域中对象的一组常量一起,它指定了一个地面马尔可夫网络,该网络为KB中一阶公式的每个可能的地面都包含一个特征,并具有相应的权重。MLN中的推断由MCMC在回答查询所需的地面网络的最小子集上执行。通过迭代优化伪似然度量,可以有效地从关系数据库中学习权重。或者,使用归纳逻辑编程技术学习附加子句。在大学领域使用真实世界的数据库和知识库进行的实验说明了这种方法的前景。 引用于164文件 MSC公司: 68立方英尺 知识表示 62小时22分 概率图形模型 68N17号 逻辑编程 68T05型 人工智能中的学习和自适应系统 68T27型 人工智能中的逻辑 关键词:统计关系学习;马尔可夫网络;马尔可夫随机场;对数线性模型;图形模型;一阶逻辑;可满足性;归纳逻辑程序设计;基于知识的模型构建;马尔科夫蒙特卡洛;假相似性;链路预测 软件:L-BFGS公司;LBFGS-B型;棱镜 PDF格式BibTeX公司 XML格式引用 \textit{M.理查森}和\textit{P.多明戈斯},马赫。学习。62,编号1--2,107-136(2006;Zbl 1470.68221) 全文: 内政部 参考文献: [1] 巴克斯·F(1990)。用概率知识表示和推理。马萨诸塞州剑桥:麻省理工学院出版社。 [2] Bacchus,F.、Grove,A.J.、Halpern,J.Y.和Koller,D.(1996)。从统计知识库到信念程度。人工智能,87,75–143·doi:10.1016/S0004-3702(96)00003-3 [3] Bergadano,F.和Giordana,A.(1988年)。概念归纳的知识密集型方法。第五届机器学习国际会议记录(第305-317页)。密歇根州安娜堡:摩根·考夫曼。 [4] Berners-Lee,T.、Hendler,J.和Lassila,O.(2001)。语义网。《科学美国人》,284:5,34-43。 [5] Besag,J.(1975年)。非晶格数据的统计分析。统计学家,24179-195·doi:10.2307/2987782 [6] Buntine,W.(1994)。使用图形模型进行学习的操作。《人工智能研究杂志》,第2159–225页。 [7] Byrd,R.H.、Lu,P.和Nocedal,J.(1995)。用于边界约束优化的有限内存算法。SIAM科学与统计计算杂志,161190-1208·Zbl 0836.65080号 ·doi:10.1137/0916069 [8] Chakrabarti,S.、Dom,B.和Indyk,P.(1998年)。使用超链接增强超文本分类。1998年ACM SIGMOD国际数据管理会议记录(第307–318页)。西雅图,华盛顿州:ACM出版社。 [9] Collins,M.(2002)。隐马尔可夫模型的判别训练方法:感知机算法的理论和实验。2002年自然语言处理经验方法会议论文集。宾夕法尼亚州费城。 [10] Cumby,C.和Roth,D.(2003)。命题化关系学习的特征提取语言。IJCAI-2003从关系数据学习统计模型研讨会论文集(第24-31页)。墨西哥阿卡普尔科:IJCAII。 [11] Cussens,J.(1999)。一阶概率推理的对数线性模型。《第十五届人工智能不确定性会议记录》(第126-133页)。瑞典斯德哥尔摩:摩根·考夫曼。 [12] Cussens,J.(2003年)。概率模型中的个体、关系和结构。《从关系数据学习统计模型的IJCAI-2003研讨会论文集》(第32-36页)。墨西哥阿卡普尔科:IJCAII。 [13] De Raedt,L.和Dehaspe,L.(1997)。条款发现。机器学习,26,99–146·Zbl 0866.68021号 ·doi:10.1023/A:1007361123060 [14] DeGroot,M.H.和Schervish,M.J.(2002年)。概率和统计。马萨诸塞州波士顿:AddisonWesley。第三版。 [15] Dehaspe,L.(1997)。带子句约束的最大熵建模。第七届归纳逻辑程序设计国际研讨会论文集(第109-125页)。捷克共和国布拉格:斯普林格。 [16] Della Pietra,S.、Della Pietera,V.和Lafferty,J.(1997)。诱导随机场的特征。IEEE模式分析和机器智能汇刊,19380–392·数字对象标识代码:10.1109/34.588021 [17] Dietterich,T.、Getoor,L.和Murphy,K.(编辑)。(2003). ICML-2004统计关系学习及其与其他领域的联系研讨会论文集。加拿大班夫:IMLS。 [18] 多明戈斯,P.和帕扎尼,M.(1997年)。简单贝叶斯分类器在零损失下的最优性。机器学习,29,103–130·Zbl 0892.68076号 ·doi:10.1023/A:1007413511361 [19] Díeroski,S.和Blockel,H.(编辑)。(2004). 第三届多相关数据挖掘国际研讨会论文集。西雅图,华盛顿州:ACM出版社。 [20] Díeroski,S.和De Raedt,L.(2003)。多关系数据挖掘专题:当前前沿。SIGKDD探索,5。 [21] Díeroski,S.、De Raedt,L.和Wrobel,S.(编辑)。(2002). 第一届多相关数据挖掘国际研讨会论文集。加拿大埃德蒙顿:ACM出版社。 [22] Díeroski,S.、De Raedt,L.和Wrobel,S.(编辑)。(2003). 第二届多关系数据挖掘国际研讨会论文集。华盛顿特区:ACM出版社。 [23] Edwards,R.和Sokal,A.(1988年)。Fortun-Kasteleyn-Swendsen-Wang表示和Monte Carlo算法的推广。《物理评论D》(第2009-2012页)。 [24] Flake,G.W.、Lawrence,S.和Giles,C.L.(2000年)。有效识别Web社区。第六届ACM SIGKDD知识发现和数据挖掘国际会议记录(第150-160页)。马萨诸塞州波士顿:ACM出版社。 [25] Friedman,N.、Getoor,L.、Koller,D.和Pfeffer,A.(1999)。学习概率关系模型。《第十六届国际人工智能联合会议记录》(第1300-1307页)。瑞典斯德哥尔摩:摩根·考夫曼。 [26] Genesereth,M.R.和Nilsson,N.J.(1987年)。人工智能的逻辑基础。加利福尼亚州圣马特奥:Morgan Kaufmann·Zbl 0645.68104号 [27] Getoor,L.和Jensen,D.(编辑)。(2000).2000年AAAI-2000从关系数据学习统计模型研讨会论文集。德克萨斯州奥斯汀:AAAI出版社。 [28] Getoor,L.和Jensen,D.(编辑)。(2003). 在IJCAI-2003《从关系数据学习统计模型研讨会论文集》中。墨西哥阿卡普尔科:IJCAII。 [29] Geyer,C.J.和Thompson,E.A.(1992年)。相关数据的约束蒙特卡罗最大似然。英国皇家统计学会杂志,B辑,54,657-699。 [30] Gilks,W.R.、Richardson,S.和Spiegelhalter,D.J.(编辑)。(1996). 马尔可夫链蒙特卡罗法在实践中的应用。英国伦敦:查普曼和霍尔·兹伯利0832.0018 [31] Halpern,J.(1990)。概率的一阶逻辑分析。人工智能,46311-350·Zbl 0723.03007号 ·doi:10.1016/0004-3702(90)90019-V [32] Heckerman,D.、Chickering,D.M.、Meek,C.、Rounthwaite,R.和Kadie,C.(2000)。推理、协同过滤和数据可视化的依赖网络。机器学习研究杂志,1,49–75·Zbl 1008.68132号 ·doi:10.11162/1532443017533444614 [33] Heckerman,D.、Geiger,D.和Chickering,D.M.(1995)。学习贝叶斯网络:知识和统计数据的结合。机器学习,20197-243·Zbl 0831.68096号 [34] Heckerman,D.、Meek,C.和Koller,D.(2004年)。概率实体关系模型、PRM和板块模型。《ICML-2004统计关系学习及其与其他领域的联系研讨会论文集》(第55-60页)。加拿大班夫:IMLS。 [35] Hulten,G.和Domingos,P.(2002年)。在恒定时间内从任意大型数据库中挖掘复杂模型。第八届ACM SIGKDD知识发现和数据挖掘国际会议论文集(第525-531页)。加拿大埃德蒙顿:ACM出版社。 [36] Jaeger,M.(1998)。用关系贝叶斯网络推理无限随机结构。第六届知识表示和推理原则国际会议记录。意大利特伦托:摩根·考夫曼。 [37] Jaeger,M.(2000年)。关于概率关系模型推理的复杂性。人工智能,117297–308·Zbl 0938.68847号 ·doi:10.1016/S0004-3702(99)00109-5 [38] Kautz,H.、Selman,B.和Jiang,Y.(1997)。一种解决具有硬约束和软约束问题的通用随机方法。D.Gu、J.Du和P.Pardalos(编辑),《可满足性问题:理论和应用》(第573-586页)。纽约州纽约市:美国数学学会·Zbl 0891.68100号 [39] Kersting,K.和De Raedt,L.(2001)。将归纳逻辑编程与贝叶斯网络相结合。第十一届归纳逻辑程序设计国际会议论文集(第118–131页)。法国斯特拉斯堡:斯普林格·Zbl 1006.68518号 [40] Laffar,J.和Lassez,J.(1987年)。约束逻辑编程。第十四届ACM编程语言原则会议记录(第111-119页)。德国慕尼黑:ACM出版社。 [41] Lavrać,N.和Díeroski,S.(1994年)。归纳逻辑程序设计:技术与应用。英国奇切斯特:Ellis Horwood。 [42] Liu,D.C.和Nocedal,J.(1989年)。关于大规模优化的有限内存BFGS方法。数学编程,45,503–528·兹伯利0696.90048 ·doi:10.1007/BF01589116 [43] Lloyd,J.W.(1987)。逻辑编程基础。德国柏林:施普林格·Zbl 0668.68004号 [44] Lloyd-Richardson,E.、Kazura,A.、Stanton,C.、Niaura,R.和Papandonatos,G.(2002年)。青少年吸烟强度的不同阶段:不同阶段的心理和社会影响。咨询与临床心理学杂志,70。 [45] Milch,B.、Marthi,B.和Russell,S.(2004)。BLOG:使用未知对象进行关系建模。ICML-2004统计关系学习及其与其他领域的联系研讨会论文集(第67-73页)。加拿大班夫:IMLS。 [46] Muggleton,S.(1996年)。随机逻辑程序。L.De Raedt(编辑),《归纳逻辑编程进展》(第254–264页)。荷兰阿姆斯特丹:IOS出版社。 [47] Neville,J.和Jensen,D.(2003年)。用关系依赖网络进行集体分类。第二届多关系数据挖掘国际研讨会论文集(第77-91页)。华盛顿特区:ACM出版社。 [48] Ngo,L.和Haddawy,P.(1997)。回答来自上下文敏感概率知识库的查询。理论计算机科学,171147-177·Zbl 0874.68280号 ·doi:10.1016/S0304-3975(96)00128-4 [49] Nilsson,N.(1986年)。概率逻辑。人工智能,28,71–87·Zbl 0589.03007号 ·doi:10.1016/0004-3702(86)90031-7 [50] Nocedal,J.和Wright,S.J.(1999)。数值优化。纽约州纽约市:斯普林格·Zbl 0930.65067号 [51] Ourston,D.和Mooney,R.J.(1994年)。结合分析和实证方法的理论完善。人工智能,66273–309·Zbl 0807.68089号 ·doi:10.1016/0004-3702(94)90028-0 [52] Parag,&Domingos,P.(2004)。多关系记录链接。第三届多相关数据挖掘国际研讨会论文集。西雅图,华盛顿州:ACM出版社。 [53] Paskin,M.(2002年)。最大熵概率逻辑(技术报告UCB/CSD-01-1161)。加州大学伯克利分校计算机科学部。 [54] Pasula,H.和Russell,S.(2001)。一阶概率语言的近似推理。第十七届国际人工智能联合会议记录(第741-748页)。华盛顿州西雅图:Morgan Kaufmann。 [55] Pazzani,M.和Kibler,D.(1992年)。归纳学习中知识的效用。机器学习,9,57–94。 [56] 珀尔,J(1988)。智能系统中的概率推理:似是而非推理网络。加利福尼亚州旧金山:Morgan Kaufmann·Zbl 0746.68089号 [57] Poole,D.(1993)。概率Horn诱拐和贝叶斯网络。人工智能,64,81–129·Zbl 0792.68176号 ·doi:10.1016/0004-3702(93)90061-F [58] Poole,D.(2003)。一阶概率推理。第十八届国际人工智能联合会议记录(第985-991页)。墨西哥阿卡普尔科:摩根·考夫曼。 [59] Popescul,A.和Ungar,L.H.(2003)。链接分析的结构逻辑回归。《第二届多关系数据挖掘国际研讨会论文集》(第92-106页)。华盛顿特区:ACM出版社。 [60] Puech,A.和Muggleton,S.(2003年)。随机逻辑程序和贝叶斯逻辑程序的比较。IJCAI-2003从关系数据学习统计模型研讨会论文集(第121-129页)。墨西哥阿卡普尔科:IJCAII。 [61] Richardson,M.和Domingos,P.(2003)。通过大规模协作建立大型知识库。第二届知识获取国际会议记录(第129-137页)。佛罗里达州萨尼贝尔岛:ACM出版社。 [62] Riezler,S.(1998年)。概率约束逻辑编程。德国图宾根大学博士论文。 [63] Robinson,J.A.(1965年)。基于解析原理的面向机器的逻辑。ACM期刊,12,23-41·Zbl 0139.12303号 ·数字对象标识代码:10.1145/321250.321253 [64] Roth,D.(1996)。关于近似推理的难度。人工智能,82273–302·doi:10.1016/0004-3702(94)00092-1 [65] Sanghai,S.、Domingos,P.和Weld,D.(2003)。动态概率关系模型。第十八届国际人工智能联合会议记录(第992-997页)。墨西哥阿卡普尔科:摩根·考夫曼。 [66] Santos Costa,V.、Page,D.、Qazi,M.和Cussens,J.(2003)。CLP(BN):概率知识的约束逻辑编程。《第十九届人工智能不确定性会议论文集》(第517-524页)。墨西哥阿卡普尔科:摩根·考夫曼。 [67] Sato,T.和Kameya,Y.(1997年)。棱镜:一种符号统计建模语言。《第十五届国际人工智能联合会议记录》(第1330–1335页)。日本名古屋:摩根·考夫曼。 [68] Taskar,B.、Abbeel,P.和Koller,D.(2002年)。关系数据的判别概率模型。《第十八届人工智能不确定性会议论文集》(第485-492页)。加拿大埃德蒙顿:摩根·考夫曼。 [69] Towell,G.G.和Shavlik,J.W.(1994年)。基于知识的人工神经网络。人工智能,70119-165·Zbl 0938.68774号 ·doi:10.1016/0004-3702(94)90105-8 [70] Wasserman,S.和Faust,K.(1994年)。社交网络分析:方法和应用。英国剑桥:剑桥大学出版社·Zbl 0926.91066号 [71] Wellman,M.、Breese,J.S.和Goldman,R.P.(1992年)。从知识库到决策模型。知识工程评论,7。 [72] 温克勒,W.(1999)。记录链接的现状和当前的研究问题。美国人口普查局统计研究部技术报告。 [73] Yedidia,J.S.、Freeman,W.T.和Weiss,Y.(2001)。广义信念传播。在T.Leen、T.Dietterich和V.Tresp(编辑)的《神经信息处理系统的进展》13689–695中。马萨诸塞州剑桥:麻省理工学院出版社。 [74] Zhu,C.、Byrd,R.H.、Lu,P.和Nocedal,J.(1997)。算法778:L-BFGSB,FORTRAN例程用于大规模边界约束优化。ACM数学软件汇刊,23550-560·Zbl 0912.65057号 ·doi:10.1145/279232.279236 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。