Efficient and Accurate Top-$K$ Recovery from Choice Data

Nguyen, Duc

计算机科学>机器学习

arXiv:2206.1995年（cs）

【于2022年6月23日提交】

标题：高效、准确地从选择数据中恢复$K$

作者：阮氏公爵

查看PDF

摘要：学习排名和选择建模的交叉点是电子商务、信息检索和社会科学应用的一个活跃研究领域。在诸如推荐系统之类的一些应用中，统计学家主要感兴趣的是使用被动收集的离散选择数据尽可能有效地从大的项目池中恢复排名靠前的项目集合，即，用户从多个项目集合中选择一个项目。出于这种实际考虑，我们提出了基于选择的Borda计数算法，作为一种快速准确的排名算法，用于排名前$K$的恢复，即正确识别所有排名前$K的项目。我们证明了在一类广泛的随机效用模型下，基于选择的Borda计数算法对于前$K$恢复具有最佳的样本复杂度。我们证明，在极限条件下，基于选择的Borda计数算法产生的top-$K$估计与常用的最大似然估计方法相同，但前者的速度和简单性在实践中带来了相当大的优势。在合成数据集和实际数据集上的实验表明，计数算法在准确性方面与常用的排序算法相比具有竞争力，但速度要快几个数量级。

学科：	机器学习（cs.LG）; 信息检索（cs.IR）
引用为：	arXiv:2206.1995年【cs.LG】
	（或 arXiv:2206.1995v1【cs.LG】对于此版本）
	https://doi.org/10.48550/arXiv.2206.11995
日志参考：	机器学习研究论文集180 PMLR 2022第1509:1518页

提交历史记录

发件人：Duc Nguyen[查看电子邮件]
[第1版]2022年6月23日星期四22:05:08 UTC（1120 KB）

全文链接：

访问纸张：

查看许可证

当前浏览上下文：

反恐精英。LG公司

<上一版本 | 下一个>

新的 | 最近的 |2022-06年

更改为浏览方式：

反恐精英
反恐精英。红外

参考文献和引文

导出BibTeX引文

计算机科学>机器学习

标题：高效、准确地从选择数据中恢复$K$

提交历史记录

访问纸张：

参考文献和引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目

计算机科学>机器学习

标题：高效、准确地从选择数据中恢复$K$

提交历史记录

访问纸张：

参考文献和引文

BibTeX格式的引文

书签

书目和引文工具

与本文相关的代码、数据和媒体

演示

推荐和搜索工具

arXivLabs：与社区合作者合作的实验项目