×

用于学习和推理的基于语义的正则化。 (英语) 兹比尔1404.68100

摘要:本文提出了一种从约束中学习的统一方法,该方法将经典机器学习技术从基于连续特征的表示中学习的能力与使用统计关系学习典型的高级语义知识进行推理的能力相结合。学习任务在多目标优化的一般框架中建模,除了传统的平滑正则化项外,还必须满足一组约束。这些约束转换了一阶逻辑公式,这些公式可以通过使用模糊逻辑表达从示例中学习到的监督和关于环境的一般先验知识。通过对测试集施加约束,本文提出了框架的自然扩展,以执行集体分类。有趣的是,该理论适用于由特征向量表示的数据和由模式标识符简单表示的数据,从而分别扩展了经典核机器和图正则化。本文还提出了对所提学习方案的概率解释,并强调了与马尔可夫逻辑网络等概率方法的有趣联系。经典基准测试的实验结果清楚地证明了相关方法的显著改进。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68T27型 人工智能中的逻辑

软件:

kFOIL公司图菲
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Baader,F.,《描述逻辑手册:理论、实现和应用》(2003),剑桥大学出版社·Zbl 1058.68107号
[2] Bard,J.F.,实用双层优化:算法和应用,非凸优化及其应用,第30卷(1998),Springer·Zbl 0943.90078号
[3] 贝尔金,M。;Niyogi,P。;Sindhwani,V.,《流形正则化:从标记和未标记示例学习的几何框架》,J.Mach。学习。研究,72434(2006)·Zbl 1222.68144号
[4] Bengio,Y.,课程学习,(第26届国际机器学习年会论文集。第26届国际机器学习年会论文集,ICML0(2009)),41-48
[5] Broecheler,M。;米哈尔科娃,L。;Getoor,L.,概率相似逻辑,(《第二十六届人工智能不确定性会议论文集》,第二十六届人造智能不确定性大会论文集,UAI(2010)),73-82
[6] Caponetto,A。;米切利,C.A。;庞蒂尔,M。;Ying,Y.,通用多任务内核,J.Mach。学习。第9号决议,1615-1646(2008)·Zbl 1225.68155号
[7] 克雷文,M。;Slattery,S.,《关系学习与统计谓词发明:超文本的更好模型》,马赫。学习。,97-119 (2001) ·Zbl 0988.68818号
[8] 坎比,C。;Roth,D.,《学习特征描述逻辑》(Learning with feature description logics),第12届归纳逻辑编程国际会议论文集(2003),施普林格出版社,32-47·Zbl 1017.68095号
[9] 坎比,C。;Roth,D.,《关系学习的核心方法》,(第二十届机器学习国际会议论文集,第二十届国际机器学习会议论文集),ICML(2003),107-114
[10] Diligenti,M。;戈里,M。;Maggini,M。;Rigutini,L.,桥接逻辑和内核机器,马赫。学习。,86, 57-88 (2012) ·Zbl 1243.68238号
[11] 多明戈斯,P。;Richardson,M.,《马尔可夫逻辑:统计关系学习的统一框架》(ICML-2004统计关系学习研讨会(2004)),49-54
[12] 多明戈斯,P。;萨姆纳,M.,《炼金术教程》(2010年)
[13] 弗里德曼,N。;盖托,L。;科勒,D。;Pfeffer,A.,《学习概率关系模型》(《国际人工智能联合会议论文集》,国际人工智能会议论文集,IJCAI(1999)),1300-1309
[14] Fung,G.M。;Mangasarian,O.L。;Shavlik,J.W.,基于知识的支持向量机分类器,(神经信息处理系统进展(2002)),521-528
[15] Fung,G.M。;Mangasarian,O.L。;Shavlik,J.W.,基于知识的非线性核分类器,(学习理论和核机器(2003),Springer),102-113·Zbl 1274.68310号
[16] Golomb,S.W。;Baumert,L.D.,《回溯编程》,J.ACM,12516-524(1965)·Zbl 0139.12305号
[17] 古普塔,M。;齐,J.,t-范数理论与模糊推理方法,模糊集系统。,40, 431-450 (1991) ·Zbl 0726.03017号
[18] Hajek,P.,《模糊逻辑的元数学》(1998),Kluwer·Zbl 0937.03030号
[19] Haralick,R.M。;Elliott,G.L.,提高约束满足问题的树搜索效率,Artif。智力。,14, 263-313 (1980)
[20] Haussler,D.,离散结构上的卷积核(1999),加州大学圣克鲁斯分校计算机科学系,技术报告
[21] 希茨勒,P。;Holldobler,S。;Sedab,A.K.,《逻辑程序与连接主义网络》,J.Appl。日志。,2, 245-272 (2004) ·Zbl 1072.68090号
[22] Huynh,T.N。;Mooney,R.J.,马尔可夫逻辑网络的判别结构和参数学习,(第25届机器学习国际会议论文集。第25届国际机器学习会议论文集,ICML(2008),ACM),416-423
[23] 科克,S。;Domingos,P.,《学习马尔可夫逻辑网络的结构》,(第22届机器学习国际会议论文集。第22届国际机器学习会议论文集,ICML(2005),ACM),441-448
[24] 北兰德威尔。;Passerini,A。;De Raedt,L。;Frasconi,P.,kfoil:学习简单关系核(AAAI人工智能会议论文集(2006)),389-394
[25] 北兰德威尔。;Passerini,A。;Raedt,L。;Frasconi,P.,关系核的快速学习,马赫。学习。(2010) ·Zbl 1470.68129号
[26] Laurer,F。;Bloch,G.,《将先验知识纳入支持向量机进行分类:综述》,神经计算,711578-1594(2009)
[27] Le,Q.V。;斯莫拉,A.J。;Gärtner,T.,《更简单的基于知识的支持向量机》,(《第23届机器学习国际会议论文集》,第23届国际机器学习会议论文集,ICML(2006),ACM),521-528
[28] 里皮,M。;Frasconi,P.,用基于特定权重的马尔可夫逻辑网络预测蛋白质(β)残基接触,生物信息学,252326-2333(2009)
[29] Lowd,D。;Domingos,P.,马尔可夫逻辑网络的有效权重学习,(第十一届欧洲数据库知识发现原理与实践会议论文集(2007)),200-211
[30] McCallum,A。;尼根,K。;Rennie,J。;Seymore,K.,《利用机器学习自动构建互联网门户》,Inf.Ret。,3, 127-163 (2000)
[31] 梅拉奇,S。;Belkin,M.,在原始J.Mach中训练的拉普拉斯支持向量机。学习。第12号决议,1149-1184(2011年)·Zbl 1280.68182号
[32] 米哈尔科娃,L。;Mooney,R.J.,马尔可夫逻辑网络结构的自底向上学习,(第24届国际机器学习会议论文集(2007),ACM:美国纽约州纽约市ACM),625-632
[33] 麻格尔顿,S。;Lodhi,H。;阿米尼,A。;Sternberg,M.J.,支持向量归纳逻辑编程,(Discovery Science(2005),Springer),163-175
[34] J·内维尔。;Jensen,D.,关系依赖网络,J.Mach。学习。研究,8653-692(2007)·Zbl 1222.68274号
[35] 牛,F。;Ré,C。;Doan,A。;Shavlik,J.,Tuffy:使用RDBMS放大马尔可夫逻辑网络中的统计推断,(VLDB学报(2011)),373-384
[36] 诺瓦克,V.,一阶模糊逻辑,Stud.Log。,46, 87-109 (1987) ·Zbl 0632.03021号
[37] Piaget,J.,《智慧心理学》(1961),阿曼德·科林:阿曼德·柯林巴黎
[38] Poggio,T。;Girosi,F.,《近似和学习网络理论》(1989),麻省理工学院,技术报告·Zbl 1226.92005号
[39] (Raedt,L.D.;Frasconi,P.;Kersting,K.S.M.,《概率归纳逻辑编程》,《人工智能课堂讲稿》,第4911卷(2008),施普林格出版社)·Zbl 1132.68007号
[40] 理查森,M。;多明戈斯,P.,马尔可夫逻辑网络,马赫。学习。,62, 107-136 (2006) ·Zbl 1470.68221号
[41] 罗西,F。;Van Beek,P。;Walsh,T.,《约束编程手册》(2006),Elsevier·Zbl 1175.90011号
[42] 肖尔科夫,B。;Smola,A.J.,《用内核学习》(2001年),麻省理工学院出版社:麻省理学院出版社,马萨诸塞州剑桥,美国
[43] 沙夫利克,J.W。;Natarajan,S.,通过预处理加快马尔可夫逻辑网络中的推理,以减小生成的接地网络的大小,(国际人工智能联合会议论文集。国际人工智能联席会议论文集,IJCAI(2009)),1951-1956
[44] Singla,P。;Domingos,P.,关系域中的记忆效率推理,(第21届AAAI人工智能会议论文集(2006),AAAI出版社),488-493
[45] Starczewski,J.T.,《模糊逻辑和成员不确定性系统的高级概念》(2012),施普林格出版社·Zbl 1254.03001号
[46] Tran,S.D.公司。;Davis,L.S.,《使用马尔可夫逻辑网络的事件建模和识别》,(《欧洲计算机视觉会议论文集》,欧洲计算机视觉大会论文集,ECCV(2008),Springer),610-623
[47] Tsochantaridis,I。;约阿希姆斯,T。;霍夫曼,T。;Altun,Y.,《结构化和相互依赖输出变量的大裕度方法》,J.Mach。学习。决议,1453-1484(2005)·Zbl 1222.68321号
[48] Vapnik,V.,《统计学习理论的本质》(2000),施普林格出版社·兹比尔0934.62009
[49] Wang,J。;Domingos,P.,混合马尔可夫逻辑网络,(第23届AAAI人工智能会议论文集(2008)),1106-1111
[50] Williams,P.M.,贝叶斯正则化和拉普拉斯先验剪枝,神经计算。,7, 117-143 (1995)
[51] Zadeh,L.A.,模糊集,信息控制,8,338-353(1965)·Zbl 0139.24606号
[52] 周,D。;Schölkopf,B.,离散空间上的正则化,模式识别。,361-368 (2005)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。