开放式访问
2009年12月 数据光谱学:卷积算子的特征空间和聚类
陶氏,米哈伊尔·贝尔金,余斌(Bin Yu)
安。统计师。 37(6B): 3960-3984 (2009年12月)。 DOI:10.1214/09-AOS700

摘要

本文的重点是从身份证样本中获取关于分布的聚类信息。我们发展了理论结果,以理解和使用数据邻接矩阵特征向量中包含的聚类信息,该特征向量基于具有足够快尾部衰减的径向核函数。特别是,我们提供了总体分析,以了解应该使用哪些特征向量,以及何时可以从样本中恢复分布的聚类信息。我们了解到,固定数量的顶级特征向量可能同时包含冗余的聚类信息,并丢失相关的聚类信息。我们利用这一洞察力设计数据分光镜聚类(DaSpec)算法,利用适当选择的特征向量自动确定簇数并对数据进行相应分组。我们的发现扩展了现有光谱技术(如光谱聚类和内核主成分分析)的直觉,并为其可用性和故障模式提供了新的理解。对真实数据进行了仿真研究和实验,以展示我们算法的潜力。特别是,DaSpec被发现可以更好地处理不平衡的组,并恢复不同形状的簇,而不是竞争方法。

引用

下载引文

陶氏。 米哈伊尔·贝尔金。 于斌。 “数据光谱学:卷积算子和聚类的特征空间。” 安。统计师。 37 (6B) 3960 - 3984, 2009年12月。 https://doi.org/10.1214/09-AOS700

问询处

出版日期:2009年12月
首次在欧几里得项目中提供:2009年10月23日

zbMATH公司:1191.62114
数学科学网:MR2572449型
数字对象标识符:10.1214/09-AOS700

学科:
主要用户:62H30型
次要:68吨10

关键词:高斯核,核主成分分析,光谱聚类,支持向量机,无监督学习

版权所有©2009数学统计研究所

第37卷•第6B期•2009年12月
返回页首