×

凝聚层次聚类方法的有效算法。 (英语) Zbl 0563.62034号

当n个对象以成对差异矩阵为特征时,它们可以通过许多顺序的、凝聚的、层次的、非重叠的聚类方法中的任何一种进行聚类。这些SAHN聚类方法由范式算法定义,在最坏的情况下,该算法通常需要(O(n^3))时间来对对象进行聚类。我们描述了一种SAHN聚类算法,在最坏的情况下需要(O(n^2\log n))时间。当SAHN聚类方法表现出合理的空间畸变特性时,可以进一步改进。基于最近邻链的有效构造,我们采用SAHN聚类算法,以获得在最坏情况下需要(O(n^2))时间和空间的合理通用SAHN算法。
当n个对象以实数的k元组为特征时,它们可以通过形心SAHN聚类方法家族中的任何一种进行聚类。这些方法基于一个几何模型,其中簇由k维实空间中的点表示,被聚集的点被单个(质心)点取代。对于这个模型,我们解决了一类涉及点对称凸对象的特殊布局问题,并利用它设计了一个有效的质心聚类算法。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62-04 统计相关问题的软件、源代码等
65年第68季度 算法和问题复杂性分析

软件:

AS 15标准
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] AHO,A.V.、HOPCROFT,J.E.和ULLMAN,J.D.(1974),《计算机算法的设计与分析》,马萨诸塞州雷丁:艾迪森·韦斯利·Zbl 0326.68005号
[2] 安德伯格,M.R.(1973),《应用聚类分析》,纽约:学术出版社·Zbl 0299.62029号
[3] BATAGELJ,V.(1981),“关于超度量层次聚类算法的注释”,《心理学》,46,351-352·doi:10.1007/BF02293743
[4] BENZECRI,J.P.(1982年),《建筑分类——阿森丹特等级体系》(Construction d'une Classification Ascendante Hierarchique par la Recherche en Chaãne des Voisins Réciproques),《唐纳分析》,第七期,第209–218页·Zbl 0492.62049号
[5] 布鲁因诺赫,M.(1978),“阿森丹特高等艺术学院的分类:非阿尔戈里特急流艺术学院建筑设计研究”,《多恩艺术学院分析》,第三期,第7–33页。
[6] CORMACK,R.M.(1971),“分类综述”,《皇家统计学会期刊》,A辑,134,321-367·doi:10.2307/2344237
[7] COXETER,H.S.M.(1963),“可接触另一个相同大小的相等非重叠球体数量的上限”,摘自《纯数学研讨会论文集》第七卷,凸性,第V.Klee版,罗德岛普罗维登斯:美国数学学会,53-71·Zbl 0136.43301号
[8] DEFAYS,D.(1977),“完整链接方法的有效算法”,《计算机杂志》,第20期,第364–366页·Zbl 0364.68038号 ·doi:10.1093/comjnl/20.4.364
[9] DUBIEN,J.L.和WARDE,W.D.(1979),“聚合聚类算法无限族成员的数学比较”,《加拿大统计杂志》,第7期,第29–38页·Zbl 0426.62040号 ·doi:10.2307/3315012
[10] EDELSBRUNNER,H.和VAN LEEUWEN,J.(1983年),“多维数据结构和算法——参考书目”,报告F 104,奥地利格拉茨格拉茨科技大学福尔信息研究所verarbeitung。
[11] EVERITT,B.(1980)。聚类分析(第二版),伦敦:海涅曼·Zbl 0507.62060号
[12] FLORIAN,A.(1980),“Newtonsche und Hadwigersche Zahlen”,报告145,奥地利萨尔茨堡萨尔茨堡大学数学研究所·Zbl 0454.52006号
[13] GOWER,J.C.和ROSS,G.J.S.(1969),“最小生成树和单连锁聚类分析”,应用统计学,18,54–64·doi:10.2307/2346439
[14] GROEMER,H.(1961年),“Abschätzungen für die Anzahl der konvexen Körper,die einen konveven Köerper berühren”,莫纳塞夫·马塞马克,65,74-81·Zbl 0096.16701号 ·doi:10.1007/BF01322659
[15] GRUNBAUM,B.(1961),“关于H.Hadwiger的一个猜想”,《太平洋数学杂志》,第11期,第215-219页。
[16] HADWIGER,H.(1957年),“Uber Trefanzahlen bei translationsgleichen Eikörpern”,《数学档案》,第8212-213页·Zbl 0080.15501号 ·doi:10.1007/BF01899995
[17] HADWIGER,H.和DEBRUNNER,H.(1955年),《埃比纳几何》,《Genève:数学工程专著》·Zbl 0066.16503号
[18] HARTIGAN,J.A.(1975),聚类算法,纽约:John Wiley·Zbl 0372.62040号
[19] HUBERT,L.和SCHULTZ,J.(1975),“层次聚类和空间畸变概念”,《英国数学与统计心理学杂志》,第28期,第121-133页·Zbl 0326.62042号
[20] HWANG,F.K.(1979),“直线最小生成树的0(n log n)算法”,计算机械协会杂志,26,177-182·Zbl 0395.68064号
[21] JARDINE,N.和SIBSON,R.(1971),《数学分类学》,伦敦:约翰·威利·Zbl 0322.62065号
[22] JOHNSON,S.C.(1967),“层次聚类方案”,《心理测量学》,32,241-254·Zbl 1367.62191号 ·doi:10.1007/BF02289588
[23] JUAN,J.(1982年),《高等分类法方案》,《教育研究》,《多恩分析》,第七期,219–225页·Zbl 0505.62042号
[24] LANCE,G.N.和WILLIAMS,W.T.(1966),“计算机分类的广义排序策略”,《自然》,212,218。
[25] LANCE,G.N.和WILLIAMS,W.T.(1967),“分类排序策略的一般理论”。1.层次系统,《计算机杂志》,9373–380。
[26] MILLIGAN,G.W.(1979),“超度量层次聚类算法”,《心理测量学》,44,343–346·Zbl 0422.62057号 ·doi:10.1007/BF02294699
[27] MURTAGH,F.(1983),“层次聚类算法的最新进展综述”,《计算机杂志》,第26期,第354–359页·Zbl 0523.68030号
[28] ROHLF,F.J.(1973),“算法76。使用最小生成树的分层聚类,“计算机期刊,16,93–95。
[29] ROHLF,F.J.(1977),“聚集聚类算法的计算效率”,报告RC 6831,IBM T.J.Watson研究中心,纽约约克敦高地。
[30] ROHLF,F.J.(1978),“概率最小生成树算法”,《信息处理快报》,第7期,第44–48页·Zbl 0365.68027号 ·doi:10.1016/0020-0190(78)90039-X
[31] ROHLF,F.J.(1982年),“单链聚类算法”,收录于《统计手册》第2卷,P.R.Krishnaiah编辑和Kanal法律公告,阿姆斯特丹和纽约:北荷兰,267-284·Zbl 0511.62074号
[32] ROSS,G.J.S.(1969),“算法AS 15。单连锁聚类分析,“应用统计学,18,106–110·doi:10.2307/2346452
[33] SHAMOS,M.I.和HOEY,D.(1975),“最近点问题”,第十六届计算机科学基础研讨会,纽约:电气和电子工程师学会,151-162。
[34] SIBSON,R.(1973),“SLINK:单链簇方法的最优高效算法”,《计算机杂志》,第16、30–34页·doi:10.1093/comjnl/16.130
[35] SNEATH,P.H.A.和SOKAL,R.R.(1973),《数值分类学》,旧金山:W.H.Freeman·Zbl 0285.92001
[36] WARD,Jr.,J.H.(1963),“优化目标函数的分层分组”,《美国统计协会杂志》,58236-244·doi:10.2307/2282967
[37] WEIDE,B.(1977),“离散算法分析技术综述”,《计算调查》,9291–313·Zbl 0366.68040号 ·数字对象标识代码:10.1145/356707.356711
[38] WISHART,D.(1969),“256注:层次分类算法”,《生物计量学》,第25期,第165-170页·doi:10.2307/2528688
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。