×

重新安排集群:陷阱、补救措施和应用程序。 (英语) Zbl 1222.68172号

摘要:给定一个值矩阵,其中的行对应于对象,列对应于对象的特征,重排聚类就是重新排列矩阵的行,使相邻行之间的相似度之和最大化。在过去的三十年中,这种聚类技术被各种各样的名称所引用,并被多次重新发明,在许多领域得到了广泛的应用。在本文中,我们指出了两个以前被忽视的关键陷阱。当重排聚类应用于形成自然聚类的对象时,第一个陷阱是有害的。第二个是常用的相似性度量。我们提出了一种克服这些缺陷的算法。该算法基于旅行商问题的一种变体。它提供了额外的好处,因为它可以自动确定集群边界。使用该算法,我们优化地解决了四个基准问题和一个2467基因表达数据聚类问题。正如预期的那样,我们的新算法在所有五种情况下都能识别出比以前方法更好的簇。总之,我们的结果证明了纠正缺陷的好处,并举例说明了这种聚类技术的有用性。我们的代码可以在我们的网站上找到。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别

软件:

TSP软件
PDF格式BibTeX公司 XML格式引用
全文: 链接