×

学习在PRISM排名。 (英语) Zbl 1452.68152号

摘要:与命题相关的学习参数是概率逻辑编程(PLP)的主要任务之一,PLP的学习算法主要是基于最大似然估计或判别准则的优化而开发的。本文探索了另一种创新的参数学习方法,学习排名或排名学习,这主要是在偏好学习领域进行的研究。我们将学习排序与PLP中开发的技术相结合,使后者适用于各种排序问题,例如信息检索。我们在基于分布语义的PLP系统PRISM中实现了我们的方法。它支持许多参数学习算法,如期望最大化算法、变分贝叶斯算法和维特比训练算法,通过将它们映射到一个称为解释图的数据结构上,从而有效地进行训练。为了通过学习排序来确保与当前PRISM中相同的参数学习效率,我们引入了一种基于梯度的学习方法,该方法利用解释图上的动态规划。本文还介绍了三个实验结果。第一种方法是使用合成数据来检查所提方法的学习行为。第二种方法使用知识库(知识图)并将秩学习应用于DistMult模型,以确定实体之间是否存在关系。最后一种方法解决了概率上下文无关语法的解析问题,该语法的参数通过秩学习从树语料库中学习。这些实验成功地证明了学习在PLP中排名的潜力和有效性。我们计划在不久的将来发布一个新版本的PRISM,增加了学习排名的能力。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68N17号 逻辑编程
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bordes,A。;Usunier,N。;Garcia-Duran,A。;J·韦斯顿。;Yakhnenko,O.,为多关系数据建模翻译嵌入,(神经信息处理系统进展(2013)),2787-2795
[2] 伯格斯,C。;摇晃,T。;伦肖,E。;拉齐尔,A。;契约,M。;北卡罗来纳州汉密尔顿。;Hullender,G.,《使用梯度下降学习排名》,(第22届机器学习国际会议论文集(2005),ACM),89-96
[3] 曹,Z。;秦,T。;Liu,T.Y。;蔡明富。;Li,H.,《学习排名:从成对方法到列表方法》,(第24届机器学习国际会议论文集(2007),ACM),129-136
[4] De Raedt,L。;Kimmig,A。;Toivonen,H.,Problog:概率序言及其在链路发现中的应用,(IJCAI,第7卷(2007)),2462-2467
[5] Finkel,J.R。;克莱曼,A。;Manning,C.D.,《高效、基于特征的条件随机场解析》(ACL,第46卷(2008)),959-967
[6] 弗伦德,Y。;Iyer,R。;夏皮雷,R.E。;Singer,Y.,一种用于组合偏好的高效提升算法,J.Mach。学习。决议,933-969年11月4日(2003年)·Zbl 1098.68652号
[7] Joachims,T.,使用点击数据优化搜索引擎,(第八届ACM SIGKDD知识发现和数据挖掘国际会议论文集(2002),ACM),133-142
[8] Johnson,M.,为什么EM没有找到好的HMM POS标签?,(EMNLP-CoNLL(2007)),296-305
[9] Kameya,Y。;Sato,T.,带参数化逻辑程序表格的高效EM学习,(计算逻辑,第1861卷(2000),Springer),269-284·Zbl 0983.68527号
[10] Kameya,Y。;佐藤,T。;Zhou,N.F.,《通过目标间共享提高参数化逻辑程序的EM学习效率》,(第16届欧洲人工智能会议论文集(2004),IOS出版社),490-494
[11] Kimmig,A。;Demoen,B。;De Raedt,L。;科斯塔,V.S。;Rocha,R.,关于概率逻辑编程语言problog的实现,理论与实践。日志。程序。,11, 2-3, 235-262 (2011) ·Zbl 1220.68037号
[12] 金马,D。;Ba,J.,Adam:随机优化方法(2014),arXiv预印本
[13] 小岛,R。;Sato,T.,PRISM中的前缀和中缀概率计算,(概率逻辑编程2014,ICLP研讨会(2014))
[14] 小岛,R。;Sato,T.,《通过使用前缀和中缀概率计算的解析树进行目标和计划识别》(Inductive Logic Programming(2015),Springer),76-91
[15] 科克,S。;Domingos,P.,使用结构模体学习马尔可夫逻辑网络,(第27届机器学习国际会议论文集(2010)),551-558
[16] Liu,T.Y.,《信息检索学习排名》(2011),施普林格科学与商业媒体·Zbl 1227.68002号
[17] Poole,D.,独立选择逻辑及其超越,(概率归纳逻辑编程(2008),施普林格),222-243·Zbl 1137.68596号
[18] 理查森,M。;多明戈斯,P.,马尔可夫逻辑网络,马赫。学习。,62, 1, 107-136 (2006) ·Zbl 1470.68221号
[19] Sato,T.,基于逻辑的概率建模中贝叶斯推理的通用MCMC方法,(第22届国际人工智能联合会议论文集。第22届人工智能国际联合会议论文,IJCAI’11(2011)),1472-1477
[20] Sato,T.,《具有分布语义的逻辑程序的统计学习方法》(逻辑程序设计国际会议论文集(1995),Citeser)
[21] 佐藤,T。;Kameya,Y.,符号统计建模逻辑程序的参数学习,J.Artif。智力。Res.,15,391-454(2001)·Zbl 0994.68025号
[22] 佐藤,T。;Kameya,Y.,PRISM在基于逻辑的概率建模方面的新进展,(概率归纳逻辑编程(2008),Springer),118-155·Zbl 1137.68617号
[23] 佐藤,T。;Kameya,Y。;Kurihara,K.,《通过PRISM中命题概率计算的变分贝叶斯》,《数学年鉴》。Artif公司。智力。,54, 1, 135-158 (2008) ·Zbl 1178.68591号
[24] 佐藤,T。;Kubota,K.,Viterbi在PRISM的培训,理论与实践。日志。程序。,15, 02, 147-168 (2015) ·Zbl 1379.68272号
[25] 佐藤,T。;Kubota,K。;Kameya,Y.,《一种基于逻辑的生成定义鉴别建模方法》(2014),arXiv预印本
[26] 佐藤,T。;Meyer,P.,循环解释图的无限概率计算,理论与实践。日志。程序。,14, 06, 909-937 (2014) ·Zbl 1302.68054号
[27] Shor,N.Z.,《不可微函数的最小化方法》,第3卷(2012),Springer科学与商业媒体
[28] Socher,R。;陈,D。;曼宁,C.D。;Ng,A.,用神经张量网络进行推理以完成知识库,(神经信息处理系统进展(2013)),926-934
[29] Uratani,N。;Takezawa,T。;Matsuo,H。;Morita,C.,ATR集成语音和语言数据库(1994),ATR口译电信研究实验室,日语
[30] Vennekens,J。;Verbaeten,S。;Bruynooghe,M.,带注释析取的逻辑程序,(国际逻辑编程会议(2004),施普林格),431-445·Zbl 1104.68391号
[31] Wang,W.Y。;Mazaitis,K。;Cohen,W.W.,《个性化pagerank编程:一种本地可依据的一阶概率逻辑》(第22届ACM信息与知识管理国际会议论文集(2013),ACM),2129-2138
[32] 杨,B。;Yih,W。;何,X。;高杰。;邓,L.,《在知识库中嵌入学习和推理的实体和关系》,(《学习表征国际会议论文集》,《学习表征问题国际会议论文录》,ICLR(2015))
[33] Zeiler,M.D.,Adadelta:一种自适应学习率方法(2012),arXiv预印本
[34] 周,N.F。;佐藤,T。;沈永德,线性表策略与优化,理论与实践。日志。程序。,8, 1, 81-109 (2008) ·Zbl 1128.68018号
[35] Zhu,Y。;Lan,Y。;Guo,J。;杜,P。;Cheng,X.,一种新的以主题为中心的多文档摘要的关系学习到等级方法,(第13届国际数据挖掘会议论文集。第13届数据挖掘国际会议论文集,ICDM(2013),IEEE),927-936
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。