×

在分类中识别真正的簇。 (英语) Zbl 0825.62536号

摘要:本文解决了评估聚类过程产生的聚类有效性的问题。描述了数据的几种空模型。本文回顾了前人的研究成果,指出可以根据簇内和簇间成对相异集的性质来描述它的多少。描述并说明了基于这些成对差异集评估U统计量值的蒙特卡罗测试,并用四个数据集进行了说明。最后一节进一步讨论了指定相关空模型的方法。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
91C20个 社会和行为科学中的集群
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bailey,T.A。;Dubes,R.:集群有效性配置文件。模式识别15,61-83(1982)
[2] Barnard,G.A.:讨论M.S.Bartlett的论文。英国皇家统计学会杂志,B辑25,294(1963)·兹比尔0118.14402
[3] 巴内特,V。;Kay,R。;斯内斯,P.H.A.:以陌生的形式出现的熟悉统计数据——聚类中的一个问题。统计学家28185-191(1979)
[4] Binder,D.A.:贝叶斯聚类分析。《生物特征》65、31-38(1978)·Zbl 0376.62007号
[5] Birks,H.H。;马修斯,R.W.:《苏格兰植被史研究V.英弗内斯郡阿伯内西森林晚德文西期和早法兰西期花粉和宏观化石地层学》。新植物学家80,455-484(1978)
[6] Birks,H.J.B。;Gordon,A.D.:第四纪花粉分析的数值方法。(1985)
[7] Bock,H.:统计模型和数据最好是在正常的过滤条件下进行的。Metrika梅特里卡18,120-132(1972)·Zbl 0238.62067号
[8] Bock,H.H.:自动化分类:理论与实践方法zur gruppierung und strukturierung von daten(聚类分析)。(1974) ·Zbl 0279.62013年
[9] Bock,H.H.:关于聚类分析中的一些显著性检验。分类2期刊,77-108(1985)·Zbl 0587.62048号
[10] Chand,D.R。;Kapur,S.S.:凸多面体的算法。计算机协会杂志17,78-86(1970)·Zbl 0199.50902号
[11] Engelman,L.公司。;Hartigan,J.A.:集群测试的百分点。美国统计协会杂志64,1647-1648(1969)
[12] 芬登,C.R。;戈登,A.D.:获得常见的修剪树。分类2期刊,255-276(1985)
[13] 费希尔,L。;Van Ness,J.W.:可接受的聚类程序。《生物特征》58,91-104(1971)·Zbl 0224.62030号
[14] Gordon,A.D.:分类:多元数据的探索性分析方法。(1981) ·兹比尔0507.62057
[15] 戈登:节俭的树木。分类4期刊,85-101(1987)·Zbl 0612.62090号
[16] 盖诺奇,A。;Hansen,P。;Jaumard,B.:使用直径标准进行除法层次聚类的高效算法。分类杂志8,5-30(1991)·Zbl 0739.62050号
[17] Hartigan,J.A.:用树表示相似矩阵。美国统计协会杂志62,1140-1158(1967)
[18] Hartigan,J.A.:聚类算法。(1975) ·Zbl 0372.62040号
[19] Hartigan,J.A.:聚类标准的渐近分布。统计年鉴6,117-131(1978)·兹比尔0377.62033
[20] 霍普,A.C.A.:简化的蒙特卡罗显著性检验程序。英国皇家统计学会杂志,B辑30,582-598(1968)·Zbl 0187.15901号
[21] Hubert,L.:单调不变聚类过程。《心理测量学》38,47-62(1973)·Zbl 0251.92013号
[22] Hubert,L.:图论在聚类中的一些应用。《心理学》39,283-309(1974)·Zbl 0317.62079号
[23] Hubert,L.J.:组合数据分析中的赋值方法。(1987) ·Zbl 0628.62003号
[24] Jain,A.K。;Dubes,R.C.:数据聚类算法。(1988) ·Zbl 0665.62061号
[25] Jardine,N.:朝向聚类的一般理论。生物统计学25,609-610(1969)
[26] Kruskal,W.H.:关于Wilcoxon非配对双样本检验的历史记录。美国统计协会杂志52,356-360(1957)·Zbl 0077.33505号
[27] 劳森,B。;Degens,P.O.:层次聚类分析中的Bootstrap评估。数据分析与信息学5,321-330(1988)
[28] Lerman,I.C.:LES是自动分类的基础。(1970) ·兹比尔0199.51402
[29] Lerman,I.C.:行为数据统计处理中的组合分析。质量和数量14,431-469(1980)
[30] Lerman,I.C.:阶级问题的意义是什么。数值分类学,179-198(1983)
[31] 列曼,I.C。;加扎利,N.:我们从分类树中保留了什么?图像编码实验。符号-数字数据分析和学习,27-42(1991)
[32] Ling,R.F.:关于k-簇的理论和构造。计算机期刊15,326-332(1972)·Zbl 0248.68013号
[33] Ling,R.F.:聚类分析的概率理论。美国统计协会期刊68159-164(1973)·Zbl 0285.62035号
[34] Mcquity,L.L.:等级顺序典型分析。教育和心理测量23,55-61(1963)
[35] Mcquity,L.L.:一些类型学理论和模式分析方法的共同发展。教育和心理测量27,21-46(1967)
[36] Mann,H.B。;Whitney,D.R.:关于两个随机变量中的一个是否随机大于另一个的测试。《数理统计年鉴》18,50-60(1947)·Zbl 0041.26103号
[37] Matula,D.W.:聚类分析算法的图论技术。分类和聚类,95-129(1977)
[38] 佩蒂斯,K.W。;Bailey,T.A。;Jain,A.K。;Dubes,R.C.:一种基于近邻信息的内在维度估计器。IEEE模式分析和机器智能事务PAMI-1,25-37(1979)·Zbl 0418.68074号
[39] Preparia,F.P。;Shamos,M.I.:计算几何:简介。(1988) ·Zbl 0575.68059号
[40] 里普利,B.D。;Rasson,J.P.:寻找泊松森林的边缘。应用概率杂志14,483-491(1977)·Zbl 0373.62058号
[41] 斯科特·A·J。;Symons,M.J.:基于似然比标准的聚类方法。生物统计学27,387-397(1971)
[42] 史密斯,S.P。;Jain,A.K.:测试多维数据的一致性。IEEE模式分析和机器智能事务,PAMI 6,73-81(1984)
[43] Sneath,P.H.A.:数值分类中的一些统计问题。统计学家17,1-12(1967)
[44] Sneath,P.H.A.:测试簇的区分性的方法:通过重叠测量欧几里德空间中两个簇的分离。数学地质学9123-143(1977)
[45] Sneath,P.H.A.:随机矩形分布任意分割的析取W统计量的抽样分布。数学地质学11,423-429(1979)
[46] Strauss,R.E.:关联分析中物种簇的统计意义。生态学63,634-639(1982)
[47] Van Rijsbergen,C.J.:一种聚类算法。计算机期刊13,113-115(1970)
[48] 瓦西里奥,A。;伊格纳提亚德斯。;Karydis,M.:用快速随机化算法对样带浮游植物集合进行聚类。《实验海洋生物学与生态学杂志》130,135-145(1989)
[49] Vichi,M.:关于一种灵活且计算上可行的除法聚类技术。Rivista di statistica applicata 18,199-208(1985)
[50] Ward,J.H.:优化目标函数的分层分组。美国统计协会杂志58,236-244(1963)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。