×

强大的层次聚类。 (英语) Zbl 1312.68163号

摘要:凝聚聚类是数据聚类中应用最广泛的技术之一。这种算法长期以来被广泛应用于计算生物学、社会科学、计算机视觉等许多不同领域,部分原因是其输出易于解释。然而,不幸的是,众所周知,许多经典的凝聚聚类算法对噪声不具有鲁棒性。本文提出并分析了一种新的自底向上凝聚聚类的鲁棒算法。我们表明,在数据满足多种自然属性且传统凝聚算法失效的情况下,我们的算法可以用于准确聚类。我们还展示了如何使我们的算法适应归纳设置,其中我们的给定数据只是整个数据集的一个小随机样本。对合成数据集和真实数据集的实验评估表明,在有噪声的情况下,我们的算法比其他层次化算法取得了更好的性能。

MSC公司:

68T05年 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
94甲15 信息论(总论)
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接