×

学习排序时保序替代损失的校准和后悔界。 (英语) Zbl 1300.68039号

总结:学习排名通常被简化为学习对单个对象进行评分,将“排名”步骤留给排序算法。在这种情况下,用于训练得分函数的替代损失需要相对于只看到最终排名的目标绩效度量表现良好。这种良好行为的一个特征是校准的概念,它确保最小化(在可测量函数集上)代理风险使我们能够最大限度地提高真实性能。
在本文中,我们考虑了订单预留(OP)损失族,其中包括常用的排序替代损失,如平方误差和成对损失。我们表明,它们是用诸如贴现累计增益(DCG)之类的性能度量进行校准的,但它们也是根据广泛使用的平均精度和预期倒数秩进行校准。对于一些广泛使用的OP损失,我们还导出了与几个类似DCG的评估指标相关的定量替代遗憾界。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68问题32 计算学习理论

软件:

SVM结构
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Banerjee,A.、Guo,X.和Wang,H.(2005)。关于作为Bregman预测器的条件期望的最优性。IEEE信息理论汇刊,51(7),2664-2669·Zbl 1284.94025号 ·doi:10.1109/TIT.2005.850145
[2] Bartlett,P.和Jordan,M.(2006年)。凸性、分类和风险边界。《美国统计学会杂志》,101(473),138-156·兹比尔1118.62330 ·doi:10.1198/01621450000000907
[3] Buffoni,D。;卡拉乌泽内斯,C。;加里纳里,P。;Usunier,N.,《订单预留损失和标准化监管的学习评分函数》,825-832(2011)
[4] 伯格斯,C.J.C。;摇晃,T。;伦肖,E。;Lazier,A。;契约,M。;北卡罗来纳州汉密尔顿。;Hullender,G.N.,《学习使用梯度下降法排名》,89-96(2005)
[5] 坎巴佐格鲁,B.B。;萨拉戈萨,H。;沙佩尔,O。;陈,J。;Liao,C。;郑,Z。;Degenhardt,J.,《加性机器学习排名系统的早期退出优化》,411-420(2010)·doi:10.145/1718487.1718538
[6] 曹毅。;徐,J。;Liu,T.Y。;李,H。;黄,Y。;Hon,H.W.,将排名支持向量机应用于文档检索,186-193(2006)
[7] 曹,Z。;Liu,T.Y.,学习排名:从成对方法到列表方法,129-136(2007)
[8] Chakrabarti,S。;Khanna,R。;美国Sawant。;Bhattacharyya,C.,非平稳排名损失的结构化学习,88-96(2008)
[9] Chapelle,O.和Chang,Y.(2011年)。雅虎!学习排列挑战概述。机器学习研究杂志,14,1-24。
[10] 沙佩尔,O。;Metlzer,D。;Zhang,Y。;Grinspan,P.,分级相关性的预期互惠等级,621-630(2009)·数字对象标识代码:10.1145/1645953.1646033
[11] 克莱门松,S。;卢戈西,G。;Vayatis,N.,使用经验风险最小化进行排名和评分,783-800(2005)·Zbl 1137.68527号
[12] Clémençon,S.和Vayatis,N.(2007年)。对最佳实例进行排名。机器学习研究杂志,82671-2699·Zbl 1222.68171号
[13] 科恩,W.W。;夏皮雷,R.E。;辛格,Y.,《学习订购》,243-270(1997)·Zbl 0915.68031号
[14] Cossock,D.和Zhang,T.(2008)。贝叶斯最优子集排序的统计分析。IEEE信息理论汇刊,54(11),5140-5154·兹比尔1319.62042 ·doi:10.1109/TIT.2008.929939
[15] Crammer,K.和Singer,Y.(2002年)。关于基于多类核的向量机的算法实现。机器学习研究杂志,2,265-292·Zbl 1037.68110号
[16] Dekel,O。;曼宁,C.D。;Singer,Y.,标签排名的对数线性模型(2003)
[17] Dembczynski,K。;科特洛夫斯基,W。;Huellermeier,E.,通过单变量损失的一致多标签排名,1319-1326(2012)
[18] 杜奇,J。;Mackey,L.W。;Jordan,M.I.,《关于排名算法的一致性》,327-334(2010)
[19] Freund,Y.、Iyer,R.、Schapire,R.E.和Singer,Y.(2003)。用于组合偏好的有效增强算法。机器学习研究杂志,4933-969·兹比尔1098.68652
[20] Järvelin,K.和Kekäläinen,J.(2002)。基于累积收益的红外技术评估。ACM信息系统交易,20,422-446·数字对象标识代码:10.1145/582415.582418
[21] Joachims,T.,使用点击数据优化搜索引擎,133-142(2002)
[22] 科特洛夫斯基,W。;Dembczynski,K。;Huellermeier,E.,通过最小化单变量损失的二元排名,1113-1120(2011)
[23] Le,Q.V.和Smola,A.J.(2007)。直接优化排名指标。技术报告,NICTA。
[24] Lee,J.(2003)。数学研究生教材:光滑流形导论。柏林:斯普林格。 ·doi:10.1007/978-0-387-21752-9
[25] Liu,T.Y.(2009)。学习为信息检索排名。信息检索的基础和趋势,3225-331·doi:10.1561/1500000016
[26] Ravikumar,P.D.、Tewari,A.和Yang,E.(2011年)。列表排序方法的NDCG一致性。机器学习研究进展跟踪杂志,15,618-626。
[27] Scott,C.,《成本敏感分类的替代损失和遗憾界限》,以独立成本为例,153-160(2011)
[28] 斯坦瓦特,I.(2007)。如何比较不同的损失函数及其风险。构造近似,26(2),225-287·Zbl 1127.68089号 ·doi:10.1007/s00365-006-0662-3
[29] Tewari,A.和Bartlett,P.(2007年)。关于多类分类方法的一致性。机器学习研究杂志,81007-1025·Zbl 1222.62079号
[30] Vembu,S.公司。;Gärtner,T.,标签排名算法:调查,1530-1537(2009),柏林·Zbl 1197.42023号
[31] Voorhees,E.和Harman,D.(2005)。TREC:信息检索实验与评估。数字图书馆和电子出版。剑桥:麻省理工学院出版社。
[32] 韦斯顿,J。;Watkins,C.,多类模式识别的支持向量机,219-224(1999)
[33] Yu,Y。;Finley,T。;拉德林斯基,F。;Joachims,T.,用于优化平均精度的支持向量方法,271-278(2007)
[34] 张涛(2004)。统计分析了一些多类别大幅度分类方法。机器学习研究杂志,51225-1251·Zbl 1222.68344号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。