×

ProPPR示例的在线概率理论修订。 (英语) 兹比尔1493.68300

摘要:考虑到普遍存在的传感器和互联网生产的内容(如社交网络和知识图)的可用性,处理关系数据流已成为一项关键任务。在关系环境中,这是一项特别具有挑战性的任务,因为无法确保示例流在迭代过程中是独立的。因此,大多数关系学习系统仍然设计为只从封闭的数据批次中学习。此外,在存在先前获取的模型的情况下,这些系统要么会丢弃它,要么认为它是正确的。在这项工作中,我们提出了一种在线关系学习算法,可以在关系示例到达时处理连续、开放的关系示例流。我们采用理论修正技术,以利用先前获得的模型作为起点,通过找出应在何处对其进行修改以应对新的示例,并自动更新它。我们依靠霍夫丁的边界统计理论来决定模型实际上是否必须,根据新示例进行更新。该算法基于ProPPR统计关系语言,旨在考虑实际数据固有的不确定性。社交网络和实体共同参考数据集的实验结果表明,与其他关系型学习者相比,该方法具有潜力。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68N17号 逻辑编程
68周27 在线算法;流式算法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Andersen,R.、Chung,F.和Lang,K.(2006年)。使用PageRank向量进行局部图分区。第47届IEEE计算机科学基础年会论文集,IEEE计算机学会,华盛顿特区,美国FOCS’06(第475-486页)。
[2] 安德森·R。;Chung,F。;Lang,K.,使用PageRank对有向图进行局部划分,166-178(2007),柏林:施普林格出版社,柏林·Zbl 1136.68317号
[3] Bifet,A。;霍姆斯,G。;柯克比,R。;Pfahringer,B.,Moa:大规模在线分析,机器学习,11601-1604(2010)
[4] Blockeel,H。;De Raedt,L.,一阶逻辑决策树的自顶向下归纳法,人工智能,101,1-2,285-297(1998)·Zbl 0909.68034号 ·doi:10.1016/S0004-3702(98)00034-4
[5] Blockeel,H。;De Raedt,L。;雅各布斯,N。;Demoen,B.,通过从解释中学习来扩大归纳逻辑编程,数据挖掘和知识发现,3,1,59-93(1999)·doi:10.1023/A:1009867806624
[6] Cardoso,P.M.和Zaverucha,G.(2006年)。对扩大ILP的方法进行比较评估。第16届国际归纳逻辑程序设计会议(ILP 2006)(第37-39页)。科伦纳:UDC出版社。
[7] 克雷文,M。;迪帕斯科,D。;弗雷塔格,D。;McCallum,A。;米切尔,T。;Nigam,K。;Slattery,S.,学习从万维网构建知识库,人工智能,118,1-269-113(2000)·Zbl 0939.68745号 ·doi:10.1016/S0004-3702(00)00004-7
[8] Dawid,AP,《当前形势和潜在发展:一些个人观点:统计理论:优先方法》,《皇家统计学会期刊A辑(综述)》,147,2,278-292(1984)·Zbl 0557.62080号 ·doi:10.2307/2981683
[9] De Raedt,L.,逻辑与关系学习(2008),柏林:施普林格出版社,柏林·Zbl 1203.68145号
[10] De Raedt,L.、Kimmig,A.和Toivonen,H.(2007)。Problog:一种概率prolog及其在链路发现中的应用。《第20届国际人工智能联合会议论文集》,摩根·考夫曼出版社,美国加利福尼亚州旧金山,IJCAI'07(第2468-2473页)。
[11] De Raedt,L。;Kersting,K。;Natarajan,S。;Poole,D.,《统计关系人工智能:逻辑、概率和计算》,《人工智能和机器学习综合讲座》,2016年第10期,第2期,第1-189页·兹比尔1352.68005 ·doi:10.2200/S00692ED1V01Y201601AIM032
[12] Domingos,P.和Hulten,G.(2000年)。挖掘高速数据流。第六届ACM SIGKDD知识发现和数据挖掘国际会议论文集,美国纽约州纽约市ACM,KDD’00(第71-80页)
[13] 德里斯,A。;De Raedt,L.,走向溪流采矿的发现,9-16(2010),柏林:施普林格,柏林
[14] Dries,A.、Kimmig,A.、Meert,W.、Renkens,J.、den Broeck,G.V.、Vlasselaer,J.和De Raedt,L.(2015)。Problog2:概率逻辑编程。在数据库中的机器学习和知识发现——欧洲会议,ECML PKDD 2015,会议记录,第三部分,LCNS(第9286卷,第312-315页)。纽约:斯普林格。
[15] 亚利桑那州杜博克;Paes,A。;Zaverucha,G.,《使用底部子句和模式声明从示例中修改FOL理论》,机器学习,76,1,73-107(2009)·Zbl 1156.68526号 ·doi:10.1007/s10994-009-5116-8
[16] Duboc,A.L.、Paes,A.和Zaverucha,G.(2017年)。关于forte_mbc理论修正算子的形式刻划。《测井计算杂志》,27(8),2551-2580·Zbl 1402.68166号
[17] Friedman,N.(1998年)。贝叶斯结构EM算法。1998年UAI:第十四届人工智能不确定性会议记录(第129-138页)。伯灵顿摩根考夫曼
[18] Gama,J.A.和Kosina,P.(2011年)。从数据流中学习决策规则。《第二十二届国际人工智能联合会议论文集——AAAI出版社》,IJCAI’11(第2卷,第1255-1260页)。
[19] 盖托,L。;迪尔,CP,链接挖掘:一项调查,ACM SIGKDD Explorations Newsletter,7,2,3-12(2005)·doi:10.1145/1117454.1117456
[20] Hoeffing,W.,有界随机变量和的概率不等式,美国统计协会杂志,58,301,13-30(1963)·Zbl 0127.10602号 ·doi:10.1080/016214591963.10500830
[21] Hulten,G.、Abe,Y.和Domingos,P.(2003)。挖掘海量关系数据库。《IJCAI-2003从关系数据学习统计模型研讨会论文集》(第53-60页)。
[22] Jensen,D.D.和Neville,J.(2002年)。关联和自相关导致关系学习中的特征选择偏差。在机器学习方面,第十九届国际会议记录(ICML 2002)(第259-266页)。伯灵顿:摩根·考夫曼。
[23] Jensen,D.D.和Neville,J.(2003)。自相关和关联导致了关系型学习者评价的偏差。在第12届国际归纳逻辑编程会议上。修订论文,《计算机科学讲义》(第2583卷,第101-116页),柏林:施普林格出版社·Zbl 1017.68521号
[24] 科特,T。;Natarajan,S。;Kersting,K。;Shavlik,J.,统计关系学习的基于梯度的提升:马尔可夫逻辑网络和缺失数据案例,机器学习,100,175-100(2015)·Zbl 1346.68159号 ·doi:10.1007/s10994-015-5481-4
[25] Lopes,C.和Zaverucha,G.(2009年)。HTilde:为非常大的数据库扩展关系决策树。2009年美国计算机学会应用计算研讨会论文集,美国纽约州纽约市美国计算机学会,SAC’09(第1475-1479页)。
[26] Menezes,G.(2011年)。HTilde-RT:Um algoritmo de aprendizado deárvores de regresssáo de lógica de primeira or em para fluxos de dados relacionais(原始资源回归算法)。巴西里约热内卢联邦大学PESC、COPPE硕士论文。
[27] Mitchell,TM,机器学习。麦格劳-希尔计算机科学系列(1997),纽约:麦格劳-Hill,纽约
[28] Muggleton,S.,《逆蕴涵与程序》,新一代计算,13,3,245-286(1995)·doi:10.1007/BF03037227
[29] 麻格尔顿,S。;De Raedt,L.,《归纳逻辑编程:理论和方法》,《逻辑编程杂志》,第19、20、629-679页(1994年)·Zbl 0816.68043号 ·doi:10.1016/0743-1066(94)90035-3
[30] Murphy,KP,《机器学习:概率观点》(2012),剑桥:麻省理工学院出版社,剑桥·Zbl 1295.68003号
[31] Natarajan,S。;科特,T。;Kersting,K。;Gutmann,B。;Shavlik,J.,《统计关系学习的基于梯度的促进:关系依赖网络案例》,机器学习,86,1,25-56(2012)·Zbl 1243.68245号 ·doi:10.1007/s10994-011-5244-9
[32] Paes,A.、Revoredo,K.、Zaverucha,G.、Costa,V.S.(2005年)。从实例中修正概率一阶理论。《归纳逻辑编程》,第15届国际会议,2005年8月10日至13日,德国波恩,ILP 2005,会议记录(第295-311页)·Zbl 1134.68550号
[33] Paes,A。;Zaverucha,G。;Costa,VS,关于使用随机局部搜索技术从实例中修正一阶逻辑理论,机器学习,106,2197-241(2017)·Zbl 1453.68172号 ·doi:10.1007/s10994-016-5595-3
[34] Page,L.、Brin,S.、Motwani,R.和Winograd,T.(1999)。PageRank引文排名:给网络带来秩序。技术报告1999-66,斯坦福信息实验室。
[35] Poon,H.和Domingos,P.(2007年)。信息提取中的联合推理。在第22届全国人工智能会议记录中,AAAI出版社,AAAI'07(第1卷,第913-918页)。
[36] Pujara,J.、London,B.、Getoor,L.和Cohen,W.(2015)。用于知识图构建的在线推理。在统计关系人工智能研讨会上。
[37] Richards,B.L.和Mooney,R.J.(1992年)。通过寻路学习关系。第十届全国人工智能会议论文集(AAAI-92),加利福尼亚州圣何塞(第50-55页)。
[38] 理查兹,BL;Mooney,RJ,一阶Horn-clause领域理论的自动精化,机器学习,19,2,95-131(1995)
[39] 理查森,M。;Domingos,P.,马尔可夫逻辑网络,机器学习,62,1,107-136(2006)·Zbl 1470.68221号 ·doi:10.1007/s10994-006-5833-1
[40] 夏皮罗,安永,算法程序调试(1983),剑桥:麻省理工学院出版社,剑桥·Zbl 0589.68003号
[41] Srinivasan,A。;Bain,M.,关系数据流在线模型的实证研究,机器学习,106,2,243-276(2017)·Zbl 1453.68158号 ·doi:10.1007/s10994-016-5596-2
[42] Tong,H.、Faloutsos,C.和Pan,J.Y.(2006)。带重启的快速随机行走及其应用。第六届数据挖掘国际会议论文集,IEEE计算机学会,美国华盛顿特区,ICDM’06(第613-622页)。
[43] 津山,K。;阿米尼,A。;斯特恩伯格,M。;Muggleton,S.,《使用归纳逻辑编程在药物发现中的脚手架跳跃》,《化学信息与建模杂志》,48,5,949-957(2008)·doi:10.1021/ci700418f
[44] Wang,WY;Mazaitis,K。;老挝,N。;Cohen,WW,《大型知识库中的高效推理和学习》,机器学习,100,1101-126(2015)·兹比尔1346.68168 ·数字对象标识代码:10.1007/s10994-015-5488-x
[45] 沃伦,DHD;佩雷拉,LM;Pereira,F.,Prolog-与Lisp相比的语言及其实现,SIGPLAN Not,12,8,109-115(1977)·doi:10.1145/872734.806939
[46] Wrobel,S.,《概念形成和知识修正》(2013),纽约:施普林格出版社,纽约·Zbl 0811.68035号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。