我们可以使用链接到您的Project Euclid帐户的电子邮件地址帮助您重置密码。
数据集的聚类是许多科学和工程领域的标准问题。谱聚类方法是基于使用核函数嵌入数据集,并使用归一化拉普拉斯算子的顶部特征向量来恢复连接的分量。我们研究了谱聚类在从非参数分布的有限混合中恢复身份证样本潜在标签方面的性能。这个标签恢复问题的难度取决于混合组分之间的重叠以及混合组分被分成两个不重叠组分的难易程度。与混合成分的不可分割性相比,当重叠较小时,种群级归一化拉普拉斯算子的主特征空间大约由平方核化成分密度跨越。在有限样本设置下,在相同的假设下,当样本量较大时,来自不同分量的嵌入样本近似正交且概率较高。作为推论,我们控制了具有非参数分量的有限混合下谱聚类错误标记样本的比例。
杰弗里·希宾格(Geoffrey Schiebinger)。 马丁·温赖特(Martin J.Wainwright)。 余斌。 “核化谱聚类的几何结构。” 安。统计师。 43 (2) 819 - 846, 2015年4月。 https://doi.org/10.1214/14-AOS1283