×

CLUES:一种基于局部收缩的非参数聚类方法。 (英语) Zbl 1452.62474号

摘要:提出了一种基于非参数局部收缩的非参数聚类方法。每个数据点的转换方式都是这样的,即向集群中心移动特定距离。每个运动的方向和相关大小由其最近邻域的中值决定。重复此过程,直到满足预定义的收敛标准。邻域数的最佳值是通过优化一些常用的指标函数来确定的,这些指标函数用于衡量算法生成的簇的强度。除了收敛的停止规则外,聚类数和最终划分都是在没有任何输入参数的情况下自动确定的。在模拟和实际数据集上的实验表明,与经典聚类算法相比,该算法具有较高的精度。

MSC公司:

62小时30分 分类和区分;聚类分析(统计方面)
62G05型 非参数估计
62J07型 岭回归;收缩估计器(拉索)
62-08 统计问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] 安德森,E.,《盖斯佩半岛的虹膜》,布尔。阿默尔。Iris Soc.,59,2-5(1935年)
[2] Ankerst,M.,Breunig,M.M.,Kriegel,H.P.,Sander,J.,1999年。光学:用于标识集群结构的排序点。摘自:《1999年ACM SIGMOD国际数据管理会议记录》,宾夕法尼亚州费城,第49-60页。;Ankerst,M.,Breunig,M.M.,Kriegel,H.P.,Sander,J.,1999年。光学:用于标识集群结构的排序点。摘自:《1999年ACM SIGMOD国际数据管理会议记录》,宾夕法尼亚州费城,第49-60页。
[3] Bradley,S.,Fayyad,U.M.,Reina,C.A.,1998年。将集群算法扩展到大型数据库。摘自:《第四届知识发现和数据挖掘国际会议论文集》,AAAI出版社,第9-15页。;Bradley,S.,Fayyad,U.M.,Reina,C.A.,1998年。将集群算法扩展到大型数据库。摘自:《第四届知识发现和数据挖掘国际会议论文集》,AAAI出版社,第9-15页。
[4] Calinski,R.B。;Harabasz,J.,用于聚类分析的树枝晶方法,Comm.Statist。,3, 1-27 (1974) ·Zbl 0273.62010
[5] 程,M.Y。;Hall,P.,校准模态的过剩质量和倾角测试,J.Roy。统计师。Soc.序列号。B、 60579-589(1998年)·Zbl 0909.62046号
[6] Cheng,Y.,Mean shift,mode searching,and clustering,IEEE Trans。模式分析。机器。智力。,17, 790-799 (1995)
[7] Comaniciu,D.,Meer,P.,1999年。均值漂移分析和应用。摘自:第七届计算机视觉国际会议记录,第1197-1203页。;Comaniciu,D.,Meer,P.,1999年。均值漂移分析和应用。摘自:第七届计算机视觉国际会议记录,第1197-1203页。
[8] Comaniciu,D.,Meer,P.,2000年。使用mean shift实时跟踪非刚性对象。摘自:IEEE计算机视觉和模式识别会议,第2卷,第142-149页。;Comaniciu,D.,Meer,P.,2000年。使用mean shift实时跟踪非刚性对象。摘自:IEEE计算机视觉和模式识别会议,第2卷,第142-149页。
[9] Comaniciu,D.,Meer,P.,2001年。可变带宽均值漂移和数据驱动的尺度选择。摘自:《第八届计算机视觉国际会议记录》,第1卷,第438-445页。;Comaniciu,D.,Meer,P.,2001年。可变带宽均值漂移和数据驱动的尺度选择。见:《第八届计算机视觉国际会议记录》,第1卷,第438-445页。
[10] 科马尼丘,D。;Meer,P.,Mean shift:一种稳健的特征空间分析方法,IEEE Trans。模式分析。机器。智力。,24, 603-619 (2002)
[11] Fisher,R.A.,《分类问题中多重测量的使用》,Ann.Eugen。,7, 179-188 (1936)
[12] 弗雷利,C。;Raftery,A.E.,基于模型的聚类、判别分析和密度估计,J.Amer。统计师。协会,97,611-631(2002)·Zbl 1073.62545号
[13] 弗里古伊,H。;Krishnapuram,R.,《计算机视觉中应用的稳健竞争聚类算法》,IEEE Trans。模式分析。机器。智力。,21, 450-465 (1999)
[14] Fukunaga,K。;Hostetler,L.D.,密度函数梯度的估计及其在模式识别中的应用,IEEE Trans。通知。理论,21,32-40(1975)·Zbl 0297.62025号
[15] Hall,P.,Heckman,N.,2000年。估计和描述随机函数分布的结构。《技术报告197》,不列颠哥伦比亚大学统计系。;Hall,P.,Heckman,N.,2000年。估计和描述随机函数分布的结构。《技术报告197》,不列颠哥伦比亚大学统计系·兹比尔0996.62030
[16] Hartigan,J.A。;Wong,M.A.,A\(k\)-表示聚类算法,应用。统计学。,28, 100-108 (1979) ·Zbl 0447.62062号
[17] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《统计学习的要素:数据挖掘、推断和预测》(2001),施普林格出版社:柏林施普林格·Zbl 0973.62007号
[18] 休伯特,L。;Arabie,P.,比较分区,J.分类,2193-218(1985)
[19] 考夫曼,L。;Rousseeuw,P.J.,《在数据中发现群体:聚类分析导论》(1990),威利:威利纽约·Zbl 1345.62009号
[20] Kundu,S.,引力聚类:基于点空间分布的新方法,模式识别,321149-1160(1999)
[21] Mack,Y.P。;Rosenblatt,M.,《多元(k)-最近邻密度估计》,《多元分析杂志》。,9, 1-15 (1979) ·Zbl 0406.62023号
[22] MacQueen,J.B.,1967年。多元观测值分类和分析的一些方法。摘自:《伯克利第五届研讨会论文集——数学统计概率》,第1卷,第281-297页。;MacQueen,J.B.,1967年。多元观测值分类和分析的一些方法。摘自:《伯克利第五届研讨会论文集——数学统计概率》,第1卷,第281-297页·Zbl 0214.46201号
[23] Maronna,R。;Jacovkis,P.M.,《具有可变指标的多元聚类程序》,生物统计学,30499-505(1974)·Zbl 0285.62036号
[24] Milligan,G.W。;Cooper,M.C.,《确定数据集中簇数的程序检查》,《心理测量学》,第50期,第159-179页(1985年)
[25] Milligan,G.W。;Cooper,M.C.,《层次聚类分析外部标准的可比性研究》,《多元行为》。决议,21,441-458(1986)
[26] 莫雷,L.C。;Agresti,A.,《分类一致性的衡量:对随机一致性的兰德统计的调整》,教育。精神病。测量。,44, 33-37 (1984)
[27] Ruspini,E.H.,模糊聚类的数值方法,Inform。科学。,2, 319-350 (1970) ·Zbl 0205.21301号
[28] Sato,Y.,《一种自主聚类技术》(Kiers,A.L.H.;Rasson,J.P.;Groenen,P.J.E.;Schader,M.,《数据分析、分类和相关方法》(2000年),Springer:Springer Berlin)·Zbl 1055.91069号
[29] Tibshirani,R.,Walther,G.,Hastie,T.,2000年。通过间隙统计估计数据集中的簇数。斯坦福大学统计系第208号技术报告。;Tibshirani,R.,Walther,G.,Hastie,T.,2000年。通过间隙统计估计数据集中的簇数。斯坦福大学统计系第208号技术报告·Zbl 0979.62046号
[30] Wang,J.H。;Rau,J.D.,《VQ聚集:一种新的聚类方法》,IEE Proc。视觉。图像信号处理。,148,36-44(2001年)
[31] Wright,W.E.,《引力聚类,模式识别》,9151-166(1977)
[32] Zhung,X。;黄,Y。;Palaniappan,K。;Lee,J.S.,高斯混合建模、分解和应用,IEEE Trans。信号处理。,5, 1293-1302 (1996)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。