×

ADvaNCE公司

swMATH ID: 29969
软件作者: 李·T。;Heinis,T。;卢克,W。
描述: ADvaNCE-基于散列的高效可扩展近似密度聚类。分析大量数据并从中提取价值已成为跨不同学科的关键。随着数据量的快速增长,当前的数据分析方法不再有效。对于成对点之间的距离计算支配整个时间的聚类算法来说,情况尤其如此:数据集中的数据点越多,距离计算所需的时间份额就越大。然而,对数据分析和聚类过程至关重要的是,它很少是直截了当的:相反,需要先确定和调整参数。因此很少需要完全准确的结果,相反,我们可以牺牲最终结果的很少精度来加速计算。在本文中,我们开发了一种基于近似DBSCAN的新方法ADvaNCE。更具体地说,我们提出了两种措施来减少距离计算开销,从而近似DBSCAN:(1)局部敏感哈希来近似和加速距离计算;(2)代表点选择来减少距离计算的次数。实验表明,随着数据集的变大,得到的聚类算法比最新的聚类算法更具可扩展性。与DBSCAN的最新近似技术相比,随着数据集大小的增加,我们的方法通常要快一个数量级(在我们的实验中最多为30倍)。
主页: https://content.iospress.com/articles/informatica/inf1136
相关软件: 数据库扫描;DBSCAN先生;高性能数据库扫描;任何DBC
引用于: 1文件

按年份列出的引文