×

基于特征排序发现的列表方法。 (英语) Zbl 1331.68196号

摘要:列表方法是一种重要的学习排序方法,它利用自动学习技术来发现有用的信息。以往关于列表方法的大多数研究都集中于使用权重优化排名模型,并使用了标记不准确的训练数据;使用特征优化排名模型在很大程度上被忽视,因此阻碍了这些方法的持续性能改进。为了解决先前列表工作的局限性,我们提出了一个准KNN模型来发现特征的排序,并使用秩相加规则来计算组合的权重。在此基础上,我们提出了三种列表算法:FeatureRank、BLFeatureBank和DiffRank。实验结果表明,我们提出的算法可以应用于严格排序的训练集,并且比最新的列表算法获得更好的性能。

MSC公司:

68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Crammer K,Singer Y。与排名作对。收录于:《2001年神经信息处理系统学报》。2001, 641–647
[2] 李鹏,伯格斯C J C,吴秋梅:学习使用多重分类和梯度提升进行排名。收录于:第21届神经信息处理系统年会论文集。2007
[3] 曹毅,徐杰,刘天勇,李浩,黄毅,洪浩。将排序支持向量机应用于文档检索。摘自:第29届国际ACM SIGIR信息检索研究与开发会议记录。2006, 186–193
[4] 蔡明发,刘天勇,秦涛,陈海华,马伟友,F银行:一种保真度损失排序方法。收录于:第30届国际ACM SIGIR信息检索研究与开发会议论文集。2007, 383–390
[5] Freund Y,Iyer R D,Schapire R E,Singer Y。一种用于组合偏好的高效提升算法。机器学习研究杂志,2003,4:933–969·Zbl 1098.68652号
[6] 曹Z,秦T,刘T Y,蔡美芬,李H。学习排名:从成对方法到列表方法。收录于:《第24届国际机器学习大会论文集》。2007, 129–136
[7] 夏F,刘天勇,王杰,张伟,李海。学习排名的列表方法:理论和算法。摘自:第25届机器学习国际会议论文集。2008, 1192–1199
[8] Xu J,Li H.Adarank:一种用于信息检索的增强算法。收录于:第30届国际ACM SIGIR信息检索研究与开发会议论文集。2007, 391–398
[9] Yue Y,Finley T,Radlinski F,Joachims T。优化平均精度的支持向量方法。收录于:第30届国际ACM SIGIR信息检索研究与开发会议论文集。2007, 271–278
[10] Qin T,Zhang X D,Tsai M F,Wang D S,Liu T Y,Li H.信息检索的查询级损失函数。信息处理与;管理学,2008,44(2):838–855·Zbl 05322410号 ·doi:10.1016/j.ipm.2007.07.016
[11] Robertson S E.okapi项目概述。文献杂志,1997,53(1):3–7·doi:10.1108/EUM0000000007186
[12] 翟C,Lafferty J D.应用于即席信息检索的语言模型平滑方法研究。摘自:第24届国际ACM SIGIR信息检索研究与开发会议记录。2001, 334–342
[13] Freund Y,Schapire R E.在线学习的决策理论推广及其在助推中的应用。计算机与系统科学杂志,1997,55(1):119–139·Zbl 0880.68103号 ·doi:10.1006/jcss.1997.1504
[14] Friedman J,Hastie T,Tibshirani R.加性逻辑回归:增长的统计观点。统计年鉴,2000,28(2):337–373·Zbl 1106.62323号 ·doi:10.1214/aos/1016218223
[15] Schapire R E,Singer Y。使用可信度评估预测改进提升算法。机器学习,1999,37(3):297–336·Zbl 0945.68194号 ·doi:10.1023/A:1007614523901
[16] Zheng Z,Zha H,Zhang T,Chapelle O,Chen K,Sun G。一种通用的提升方法及其在学习网络搜索排名函数中的应用。摘自:《第21届神经信息处理系统年会论文集》。2007, 1697–1704
[17] Hastie T、Tibshirani R、Friedman J.《统计学习的要素:数据挖掘、推断和预测》。北京:电子工业出版社,2004,337–384·Zbl 1273.62005年
[18] Baeza-Yates R A,Ribeiro-Neto B。现代信息检索。波士顿:Addison-Wesley,1999
[19] Järvelin K,Kekäläinen J.基于累积收益的红外技术评估。ACM信息系统汇刊,2002,20(4):422-446·Zbl 05457980号 ·doi:10.1145/582415.582418
[20] Kendall M G.等级相关性的新度量。《生物特征》,1938,30(1-2):81–93·Zbl 0019.13001号 ·doi:10.1093/biomet/30.1-2.81
[21] Liu T Y,Xu J,Qin T,Xiong W,Li H.Letor:信息检索中学习排名研究的基准数据集。摘自:SIGIR 2007信息检索学习排名研讨会论文集。2007, 3–10
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。