• 语料库ID:18278907

用于精确近邻搜索的随机分区树

@文章{Dasgupta2013随机PT,title={用于精确最近邻居搜索的随机化分区树},author={Sanjoy Dasgupta和Kaushik Sinha},日志={ArXiv},年份={2013},体积={abs/1302.1948},url={https://api.semanticscholar.org/CorpusID:18278907}}
k-d树是最早提出用于最近邻搜索的空间数据结构之一。它在高维空间中的功效减弱,但随着随机化和

本文中的数字

LSH与随机分区树:哪一个用于最近邻搜索?

在各种实际数据集上的实验表明,这种新的随机划分树变体的性能优于以前的变体以及用于最近邻搜索的局部敏感哈希(LSH)方法。

用于最近邻搜索的稀疏随机划分树

受快速Johnson-Lindenstraus变换的启发,提出了一种稀疏的随机划分树,其中每个内部节点只需要存储几个非零项,而不是所有的d项,从而在不牺牲最近邻搜索精度的情况下显著节省了空间。

近似最近邻的投影搜索

本文提出了一种基于树的近似最近邻搜索算法,通过将搜索区域限制在查询所在的相邻单元格内,并排除那些相隔很远的单元格,从而大大降低了树遍历的成本。

快速k-NN搜索

这项工作提出了一种方法,通过一种新的投票方案将多个随机投影树组合在一起,利用独立生成的随机投影获得的大量候选集中的冗余,以减少昂贵的精确距离评估次数。

精确固定半径最近邻搜索及其在聚类中的应用

这项工作提出了一种新的固定半径最近邻搜索方法,在索引和查询时间方面大大改进了基于蛮力和树的方法,返回准确的结果,并且不需要调整参数。

要使用哪个空间分区树进行搜索?

理论结果表明,具有更好矢量量化性能的树具有更好的搜索性能保证,并且从理论和经验上证明,大边界划分可以提高树的搜索性能。

用于最近邻查找的快速精确检索(FERN)

受kd-trees的启发,提出了一种新的用于最近邻查找的对数快速精确检索(FERN)算法,该算法在1000万d=128均匀随机生成的向量上实现了100%召回率的O(d\log N)查找。

使用辅助信息和优先级函数改进最近邻搜索

本文利用单个和多个随机投影的特性,允许我们在随机投影树的内部节点存储有意义的辅助信息,并设计优先级函数来指导搜索过程,从而提高最近邻搜索性能。
...

为最近的邻居盖上树

一种树型数据结构,用于在一般n点度量空间(其中数据集由n个点组成)中进行快速最近邻操作,该结构显示了在自然机器学习数据集上,在一个数量级到几个数量级之间的蛮力搜索中的加速比。

高维最近邻搜索的两种算法

基于一种组合基本点集随机选择的一维投影的方法,提出了一种新的最近邻问题的求解方法,该方法产生了一种搜索时间为O((d log d)(d+log n))的e近似最近邻的算法。

最近邻搜索的概率方法分析

其目标是将S预处理为数据结构,以便有效地回答最近邻查询,并在许多领域中应用,包括数据挖掘、模式分类和数据压缩。

在增长受限指标中查找最近邻居

本文为增长约束度量中的最近邻查询开发了一种有效的动态数据结构,该结构满足以下性质:对于任意点q和点r,半径为2r和r的球中点的数目之比是有界的。

导航网:邻近搜索的简单算法

这项工作提出了一种简单的确定性数据结构,用于在一般度量空间中维护一组点S,同时支持邻近搜索和更新S(插入和删除),并且在某种距离计算模型中基本上是最优的。

高维近似最近邻的近优散列算法

提出了d维欧氏空间中c近似最近邻问题的一种算法,实现了O(dn1c2/+O(1))和O(dn+n1+1c2/+O(1)的查询时间。这几乎匹配

实用近似最近邻算法研究

本文提出了一个问题:是否可以改变早期精确最近邻的空间数据结构方法(如度量树),以提供近似近似查询的答案?如果可以,如何以及为什么要这样做,并引入了一种允许重叠的新的度量树。

一种近似最近邻搜索的优化算法

本文展示了如何在O(nlog n)时间和O(n)空间中预处理Rd中的一组n个点,以便在给定查询点p E Rd且E>0的情况下,可以在O(“log n”)时间内计算q的(1+c)-近似最近邻。

快速Johnson-Lindenstrauss变换与近似最近邻

基于随机傅里叶变换对稀疏投影矩阵的预处理,引入了一种新的低失真嵌入$\ell-2^d$到$\ell_p{O(\logn)}$($p=1,2$)的方法,称为快速Johnson-Lindenstraus变换(FJLT)。

用于关联搜索的多维二叉搜索树

开发了多维二叉搜索树(或<italic>k-d树)作为一种数据结构,用于存储通过关联搜索检索的信息,并证明其存储要求非常有效。