主页

论文

提交的资料

新闻

编辑委员会

特殊问题

开源软件

程序(PMLR)

数据(DMLR)

交易(TMLR)

搜索

统计

登录

常见问题

联系我们



RSS源

一种用于近似最近邻搜索的多标签分类框架

Ville Hyvönen、Elias Jääsaari、Teemu Roos; 25(46):1−51, 2024.

摘要

为了学习用于近似最近邻(ANN)搜索的基于分区的索引结构,使用了监督和非监督机器学习算法。现有的监督算法选择与查询点属于同一分区元素的所有点作为最近邻候选点。因此,他们将学习任务表述为查找一个分区,在该分区中,查询点的最近邻居尽可能多地属于同一个分区元素。相反,我们将人工神经网络搜索中的候选集选择直接表示为多标签分类问题,其中标签对应于查询点的最近邻居。在该框架中,基于分区的索引结构被解释为用于解决此分类问题的分区分类器。实验结果表明,与早期的候选集选择方法相比,基于该框架的自然分类器与任何划分策略相结合,都能显著提高性能。我们还证明了用于ANN搜索的分区分类器一致性的充分条件,并通过对时序$k$-d树和(稠密和稀疏)随机投影树验证此条件来说明结果。

[腹肌][pdf格式][围兜]      [代码]
©JMLR公司2024(编辑,贝塔)

乳臭虫