×

Rankboost公司\(+\):对Rankboost公司. (英语) Zbl 1446.62079号

总结:Rankboost公司是一种众所周知的算法,它迭代地创建和聚合一组“弱秩”来构建有效的排名过程。关于的初始工作Rankboost公司提出了两种变体。一种变体,我们称之为Rb-d,是为所有弱秩都具有二进制范围({0,1})的情况设计的,具有良好的理论性质,但在实践中表现不佳。另一种,我们称之为Rb-c,具有良好的经验行为,是这种二进制弱秩场景的推荐变体,但缺乏理论基础。在本文中,我们通过提出一个改进的Rankboost公司我们称之为二进制弱秩场景的算法Rankboost公司\(+\). 我们证明了这种方法在理论上是合理的,并且从经验上证明了它在实践中优于两种Rankboost变量。此外,背后的理论Rankboost公司\(+\)有助于我们解释为什么Rb-d在实践中可能表现不好,以及为什么Rb-c在二进制弱秩场景中表现更好,正如之前的工作中所观察到的那样。

MSC公司:

62F07型 统计排名和选择程序
62-08 统计问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Agarwal,A.、Raghavan,H.、Subbian,K.、Melville,P.、Lawrence,R.D.、Gondek,D.C.和Fan,J.(2012)。学习为稳健的问题回答排名。《第21届ACM信息和知识管理国际会议记录》(第833-842页)。ACM。
[2] 阿加瓦尔,S。;Dugar博士。;Sengupta,S.,《药物发现的化学结构排序:一种新的机器学习方法》,《化学信息与建模杂志》,50,5716-731(2010)·doi:10.1021/ci9003865
[3] Aslam,J.A.、Kanoulas,E.、Pavlu,V.、Savev,S.和Yilmaz,E.(2009年)。记录选择方法,以实现高效的分级学习。第32届国际ACM SIGIR信息检索研究与开发会议记录(第468-475页)。ACM公司。
[4] 曹,Z.,秦,T.,刘,T.Y.,蔡,M.F.,&李,H.(2007)。学习排名:从成对方法到列表方法。摘自:《第24届机器学习国际会议论文集》(第129-136页)。ACM公司。
[5] 科恩,WW;夏皮雷,RE;辛格,Y.,《学习排序》,《人工智能研究杂志》,第10期,第243-270页(1999年)·Zbl 0915.68031号 ·doi:10.1613/jair.587
[6] Cortes,C.和Mohri,M.(2004)。AUC优化vs.错误率最小化。《第16届神经信息处理系统国际会议论文集》(第313-320页)。麻省理工学院出版社。
[7] Demšar,J.,《多数据集分类器的统计比较》,《机器学习研究杂志》,2006年1月7日至30日·Zbl 1222.68184号
[8] 弗伦德,Y。;Iyer,R。;夏皮雷,RE;Singer,Y.,一种用于组合偏好的有效增强算法,《机器学习研究杂志》,933-969年11月4日(2003)·Zbl 1098.68652号
[9] Freund,Y.和Schapire,R.E.(1995)。在线学习的决策理论推广及其在助推中的应用。在欧洲计算学习理论会议上(第23-37页)。斯普林格。
[10] Guiver,J.和Snelson,E.(2009年)。Plackett-Luce排名模型的贝叶斯推断。第26届国际机器学习年会论文集(第377-384页)。ACM公司。
[11] 哈珀,FM;Konstan,JA,The movielens datasets:History and context,ACM Transactions on Interactive Intelligent Systems(TiiS),2016年第5、4、19期
[12] Järvelin,K。;Kekäläinen,J.,基于累计收益的红外技术评估,ACM信息系统汇刊,20,4,422-446(2002)·数字对象标识代码:10.1145/582415.582418
[13] 莫赫里,M。;罗斯塔米扎德,A。;Talwalkar,A.,《机器学习基础》(2012),剑桥:麻省理工学院出版社,剑桥·兹比尔1318.68003
[14] 努雷,R。;Can,F.,《使用数据融合的信息检索系统自动排名》,信息处理与管理,42,3,595-614(2006)·Zbl 1195.68038号 ·doi:10.1016/j.ipm.2005.03.023
[15] Qin,T.,&Liu,T.(2013)。介绍LETOR 4.0数据集。CoRR公司。http://arxiv.org/abs/1306.2597
[16] 秦,T。;刘,TY;徐,J。;Li,H.,LETOR:信息检索中学习排名研究的基准集合,信息检索,13,4,346-374(2010)·doi:10.1007/s10791-009-9123-y
[17] Rudin,C.、Cortes,C.、Mohri,M.和Schapire,R.E.(2005)。基于Margin的排名在中间有所提升。在计算学习理论国际会议上(第63-78页)。施普林格·Zbl 1137.68561号
[18] Valizadegan,H.、Jin,R.、Zhang,R.和Mao,J.(2009)。通过优化NDCG指标学习排名。《第22届神经信息处理系统国际会议论文集》(1883-1891页)。Curran Associates公司。
[19] Weimer,M.、Karatzoglou,A.、Le,Q.V.和Smola,A.(2007年)。用于协作排名的COFIRANK最大裕度矩阵因子分解。《第20届神经信息处理系统国际会议论文集》(第1593-1600页)。Curran Associates公司。
[20] Xia,F.、Liu,T.Y.、Wang,J.、Zhang,W.和Li,H.(2008)。学习排名的列表方法:理论和算法。第25届机器学习国际会议论文集(第1192-1199页)。ACM公司。
[21] Zheng,Z.,Zha,H.,&Sun,G.(2008)。使用等渗回归进行查询级排序学习。2008年第46届Allerton通信、控制和计算年会(第1108-1115页)。IEEE标准。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。