开放式访问
2015年4月 核化谱聚类的几何
杰弗里·希宾格,马丁·温赖特,余斌(Bin Yu)
安。统计师。 43(2): 819-846 (2015年4月)。 数字对象标识码:10.1214/14-AOS1283

摘要

数据集的聚类是许多科学和工程领域的标准问题。谱聚类方法是基于使用核函数嵌入数据集,并使用归一化拉普拉斯算子的顶部特征向量来恢复连接的分量。我们研究了谱聚类在从非参数分布的有限混合中恢复身份证样本潜在标签方面的性能。这个标签恢复问题的难度取决于混合组分之间的重叠以及混合组分被分成两个不重叠组分的难易程度。与混合成分的不可分割性相比,当重叠较小时,种群级归一化拉普拉斯算子的主特征空间大约由平方核化成分密度跨越。在有限样本设置下,在相同的假设下,当样本量较大时,来自不同分量的嵌入样本近似正交且概率较高。作为推论,我们控制了具有非参数分量的有限混合下谱聚类错误标记样本的比例。

引文

下载引文

杰弗里·希宾格(Geoffrey Schiebinger)。 马丁·温赖特(Martin J.Wainwright)。 余斌。 “核化谱聚类的几何结构。” 安。统计师。 43 (2) 819 - 846, 2015年4月。 https://doi.org/10.1214/14-AOS1283

问询处

出版日期:2015年4月
首次在欧几里德项目中提供:2015年3月23日

zbMATH公司:1312.62082
数学科学网:3325711美元
数字对象标识符:10.1214/14-AOS1283

学科:
主要用户:6220国集团

关键词:核函数,混合物模型,归一化拉普拉斯算子,光谱聚类

版权所有©2015数学统计研究所

第43卷•第2期•2015年4月
返回页首