玛丽亚·福洛丽娜·巴尔坎;梁英玉;普拉莫德·古普塔 强大的层次聚类。 (英语) Zbl 1312.68163号 J.马赫。学习。物件。 15, 4011-4051 (2014). 摘要:凝聚聚类是数据聚类中应用最广泛的技术之一。这种算法长期以来被广泛应用于计算生物学、社会科学、计算机视觉等许多不同领域,部分原因是其输出易于解释。然而,不幸的是,众所周知,许多经典的凝聚聚类算法对噪声不具有鲁棒性。本文提出并分析了一种新的自底向上凝聚聚类的鲁棒算法。我们表明,在数据满足多种自然属性且传统凝聚算法失效的情况下,我们的算法可以用于准确聚类。我们还展示了如何使我们的算法适应归纳设置,其中我们的给定数据只是整个数据集的一个小随机样本。对合成数据集和真实数据集的实验评估表明,在有噪声的情况下,我们的算法比其他层次化算法取得了更好的性能。 引用于1审查引用于1文件 MSC公司: 68T05年 人工智能中的学习和自适应系统 62H30型 分类和区分;聚类分析(统计方面) 94甲15 信息论(总论) 68吨10 模式识别、语音识别 关键词:无监督学习;群集;凝聚算法;稳健性 PDF格式BibTeX公司 XML格式引用 \textit{M.-F.Balcan}等人,J.Mach。学习。第15号决议,4011--4051(2014年;Zbl 1312.68163) 全文: arXiv公司 链接