×

DBSCAN公司++

swMATH ID: 34904
软件作者: Jennifer Jang、Heinrich Jiang
描述: DBSCAN++:面向快速和可扩展的密度聚类。DBSCAN是一种经典的基于密度的聚类过程,具有极大的实用性。然而,DBSCAN隐含地需要计算每个样本点的经验密度,导致二次最坏情况的时间复杂性,这在大型数据集上太慢。我们提出DBSCAN++,这是对DBSCAN的一个简单修改,只需要计算所选点子集的密度。我们的经验表明,与传统的DBSCAN相比,DBSCAN++不仅可以提供有竞争力的性能,而且可以在带宽超参数方面增加鲁棒性,同时只占用一小部分运行时间。我们还提供了统计一致性保证,以显示计算成本和估计速度之间的权衡。令人惊讶的是,在一定程度上,我们可以在降低计算成本的同时享受相同的估计率,这表明DBSCAN++是一种亚二次算法,可以获得水平集估计的最小最大最优率,这一质量可能是独立的。
主页: https://arxiv.org/abs/1810.13105
源代码:  https://github.com/jenniferjang/dbscanpp网址
关键词: 机器学习(cs.LG);机器学习(stat.ML)
相关软件:
引用于: 1文件

按年份列出的引文