×

分类数据的核子空间聚类算法。 (中文)。英文摘要) Zbl 1474.62255号

摘要:目前,主流的分类数据子空间聚类方法依赖于线性相似性度量,忽略了属性之间的关系。在本研究中,提出了一种基于核软特征选择的分类数据聚类方法。首先,通过引入核函数将分类数据投影到高维核空间中,给出了分类数据在核子空间中的相似性度量。基于该测度,导出了核子空间聚类目标函数,并提出了求解该目标函数的优化方法。最后,提出了分类数据的核子空间聚类算法。该算法考虑了属性之间的关系,并为每个属性分配了度量其与聚类的相关性程度的权重,从而在聚类过程中实现了自动特征选择。还定义了一个聚类有效性指数来评估分类聚类。在一些合成数据集和真实数据集上的实验结果表明,该方法有效地挖掘了属性之间的非线性关系,提高了聚类的性能和效率。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部