×

集群集成–用于组合多个分区的知识重用框架。 (英语) Zbl 1084.68759号

摘要:本文介绍了将一组对象的多个分区组合成一个单一的合并集群而不访问决定这些分区的功能或算法的问题。我们首先确定了生成的“知识重用”框架(我们称之为集群集成)的几个应用场景。然后,根据共享的互信息,将集群集成问题形式化为组合优化问题。除了直接最大化方法外,我们还提出了三种有效的技术来获得高质量的合并器(一致性函数)。第一个合并器从分区中归纳出相似性度量,然后重新对对象进行聚类。第二个合并器基于超图划分。第三种方法将簇组分解为元簇,然后元簇竞争每个对象以确定组合的簇。由于我们的技术计算成本低,使用超consensus函数,根据目标函数评估所有三种方法,并为给定情况选择最佳解决方案,这是非常可行的。我们在三种不同的应用场景中评估了簇集合的有效性:(i)原始簇是基于不相同的特征集形成的,(ii)原始聚类算法在不相同的对象集上工作,以及(iii)在使用公共数据集的情况下,组合多个聚类的主要目的是提高解决方案的质量和健壮性。对于合成数据集和真实数据集,在所有三种情况下都获得了有希望的结果。

MSC公司:

68T05型 人工智能中的学习和自适应系统

关键词:

相互信息
PDF格式BibTeX公司 XML格式引用
全文: 内政部