我们可以使用链接到您的Project Euclid帐户的电子邮件地址帮助您重置密码。
本文的重点是从身份证样本中获取关于分布的聚类信息。我们发展了理论结果,以理解和使用数据邻接矩阵特征向量中包含的聚类信息,该特征向量基于具有足够快尾部衰减的径向核函数。特别是,我们提供了总体分析,以了解应该使用哪些特征向量,以及何时可以从样本中恢复分布的聚类信息。我们了解到,固定数量的顶级特征向量可能同时包含冗余的聚类信息,并丢失相关的聚类信息。我们利用这一洞察力设计数据分光镜聚类(DaSpec)算法,利用适当选择的特征向量自动确定簇数并对数据进行相应分组。我们的发现扩展了现有光谱技术(如光谱聚类和内核主成分分析)的直觉,并为其可用性和故障模式提供了新的理解。对真实数据进行了仿真研究和实验,以展示我们算法的潜力。特别是,DaSpec被发现可以更好地处理不平衡的组,并恢复不同形状的簇,而不是竞争方法。
陶氏。 米哈伊尔·贝尔金。 于斌。 “数据光谱学:卷积算子和聚类的特征空间。” 安。统计师。 37 (6B) 3960 - 3984, 2009年12月。 https://doi.org/10.1214/09-AOS700