DBSCAN公司++ swMATH ID: 34904 软件作者: Jennifer Jang、Heinrich Jiang 描述: DBSCAN++:面向快速和可扩展的密度聚类。DBSCAN是一种经典的基于密度的聚类过程,具有极大的实用性。然而,DBSCAN隐含地需要计算每个样本点的经验密度,导致二次最坏情况的时间复杂性,这在大型数据集上太慢。我们提出DBSCAN++,这是对DBSCAN的一个简单修改,只需要计算所选点子集的密度。我们的经验表明,与传统的DBSCAN相比,DBSCAN++不仅可以提供有竞争力的性能,而且可以在带宽超参数方面增加鲁棒性,同时只占用一小部分运行时间。我们还提供了统计一致性保证,以显示计算成本和估计速度之间的权衡。令人惊讶的是,在一定程度上,我们可以在降低计算成本的同时享受相同的估计率,这表明DBSCAN++是一种亚二次算法,可以获得水平集估计的最小最大最优率,这一质量可能是独立的。 主页: https://arxiv.org/abs/1810.13105 源代码: https://github.com/jenniferjang/dbscanpp网址 关键词: 机器学习(cs.LG);机器学习(stat.ML) 相关软件: 引用于: 1文件 3位作者引用 1 鲁、信阳 1 亚历山德罗·里纳尔多 1 王大仁 连载1篇 1 机器学习研究杂志(JMLR) 在3个字段中引用 1 组合数学(05-XX) 1 统计学(62-XX) 1 计算机科学(68至XX) 按年份列出的引文