彼得·拉德琴科;古拉布·穆克吉 通过\(l_1\)融合惩罚的凸聚类。 (英语) Zbl 1381.62193号 J.R.Stat.Soc.,序列号。B、 统计方法。 79,第5期,1527-1546(2017)。 摘要:我们研究了凸聚类框架的大样本行为,该框架在聚类质心上的(l_1)融合约束下,使聚类平方和内的样本最小化。最近提出的这种方法越来越受欢迎;然而,它的渐近性质大多是未知的。我们的分析基于样本聚类过程的一种新表示,即由一系列最大化问题确定的聚类分裂序列。我们使用这种表示法为人口聚类过程提供了一个简单直观的公式。然后,我们证明了样本过程一致地估计了它的总体相似性,并推导了相应的收敛速度。该证明对一组M估计问题进行了仔细的同时分析,这些问题的基数随着样本量的增加而增加。在从渐近研究中获得的新观点的基础上,我们提出了对原始聚类框架的关键后处理修改。我们从理论和经验上表明,所得到的方法可以成功地用于估计种群中的聚类数量。使用模拟数据,我们将该方法与现有的聚类数和模态评估方法进行了比较,并获得了令人鼓舞的结果。我们还证明了我们的聚类方法在单细胞病毒学研究中检测细胞亚群的适用性。 引用于15文件 MSC公司: 62H30型 分类和区分;聚类分析(统计方面) 6220国集团 非参数推理的渐近性质 62页第10页 统计学在生物学和医学中的应用;元分析 关键词:凸聚类;融合惩罚;集群数量;收敛速度;大样本行为 PDF格式BibTeX公司 XML格式引用 \textit{P.Radchenko}和\textit{G.Mukherjee},J.R.Stat.Soc.,Ser。B、 统计方法。79,第5号,1527--1546(2017;Zbl 1381.62193) 全文: 内政部 arXiv公司