罗伯特·提比拉尼;Guenther Walther;特雷弗·哈斯蒂 通过间隙统计估计数据集中的簇数。 (英语) 兹比尔0979.62046 J.R.Stat.Soc.,塞尔维亚。B、 统计方法。 63,第2期,411-423(2001). 摘要:我们提出了一种方法(“间隙统计”)来估计一组数据中的簇(组)数量。该技术使用任何聚类算法的输出(例如,K均值或层次),将簇内离散度的变化与适当参考零分布下的预期变化进行比较。为该建议开发了一些理论,模拟研究表明,缺口统计通常优于文献中提出的其他方法。 引用于2评论引用于235文件 MSC公司: 62H30型 分类和区分;聚类分析(统计方面) 关键词:等级制度;聚类;均匀分布;组;群集 PDF格式BibTeX公司 XML格式引用 \textit{R.Tibshirani}等人,J.R.Stat.Soc.,Ser。B、 统计方法。63,第2号,411--423(2001;Zbl 0979.62046) 全文: 内政部