×

一种新的无坐标数据聚类算法。 (英语) Zbl 1192.68576号

摘要:本文提出了一种新的寻找相似对象簇的方法——彩色法氏邻图(CFNG)。该方法非常有用,因为它既适用于有坐标的对象,也适用于无坐标的对象。唯一的要求是可以计算任意两个对象之间的距离。换句话说,对象必须属于度量空间。CFNG使用图形着色来改进Rovetta和Masulli的现有技术。就像他们的技术一样,它使用递归分区来构建集群的层次结构。在递归分区中,有时会过早地拆分集群,本文的贡献之一是减少这种过早拆分的发生,当使用其他分区方法来查找集群时,也会出现这种情况。

MSC公司:

68吨10 模式识别、语音识别
05C15号 图和超图的着色
62H30型 分类和区分;聚类分析(统计方面)
54E35个 度量空间,可度量性

软件:

群集查找
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿佩尔,K。;Haken,W。;Koch,J.,每个平面图都是四色的,J.Math。,21, 439-567 (1977) ·兹伯利0387.05010
[2] Bentley,J.L.,用于关联搜索的多维二叉搜索树,Commun。ACM,18,9,509-517(1975)·Zbl 0306.68061号
[3] Bentley,J.L。;Kung,H.T。;Schkolnick,M。;汤普森,C.D.,关于向量集合中最大值的平均数及其应用,J.ACM,25536-543(1978)·Zbl 0388.68056号
[4] P.Berkhin,《聚类数据挖掘技术调查》,技术报告,Accrue Software,加州圣何塞,2002年。;P.Berkhin,《聚类数据挖掘技术调查》,技术报告,Accrue Software,加利福尼亚州圣何塞,2002年。
[5] Chand,D.R。;Kapur,S.S.,凸多面体的算法,J.ACM,7,78-86(1970)·Zbl 0199.50902号
[6] D.Eppstein,使用旋转卡尺图更新宽度和最大生成树,技术报告93-18,加州大学欧文分校CS部门,1993年。;D.Eppstein,使用旋转卡尺图更新宽度和最大生成树,技术报告93-18,加州大学欧文分校CS部门,1993年。
[7] Driscoll,C.A.,《猫驯化的近东起源》,《科学》,317519-523(2007)
[8] 芬克尔,R。;Bentley,J.L.,《四叉树:复合键检索的数据结构》,Acta Inf.,4,1,1-9(1974)·Zbl 0278.68030号
[9] Fortune,S.,《Voronoi图的扫线算法》,《算法》,2153-174(1987)·Zbl 0642.68079号
[10] X.Gao,B.Xiao,D.Tao,X.Li,图形编辑距离调查,模式分析。申请。(2009),doi:10.1007/s10044-008-0141-y。;X.Gao,B.Xiao,D.Tao,X.Li,图形编辑距离调查,模式分析。申请。(2009),doi:10.1007/s10044-008-0141-y·Zbl 1422.68211号
[11] A.Guttman,R-trees:A dynamic index structure for spatial searching,in:1984 ACM SIGMOD International Conference on Management of Data,1984,pp.47-57。;A.Guttman,R树:空间搜索的动态索引结构,载于:1984年ACM SIGMOD国际数据管理会议,1984年,第47-57页。
[12] Jain,A.K。;Murty,M.N。;Flynn,P.J.,《数据聚类:综述》,ACM计算调查,31,3,264-323(1999)
[13] 蒋,X。;Bunke,H。;Csirik,J.,《中值字符串:综述》(Last,M.;Kandel,a.;Bunke,H.,《时间序列数据库中的数据挖掘》(2004),《世界科学:世界科学新加坡》,173-192年)
[14] Ward,J.H.,优化目标函数的分层分组,美国统计协会,58,236-244(1963)
[15] 卡普,R.M.,组合问题中的可还原性,(Miller,R.E.;Thatcher,J.W.,计算机计算的复杂性(1972),Plenum:Plenum New York)·兹伯利0366.68041
[16] 考夫曼,L。;Rousseeuw,P.,《在数据中发现群体:聚类分析导论》(1990年),威利出版社:威利纽约·Zbl 1345.62009号
[17] King,B.,逐步聚类程序,美国统计协会,69,86-101(1967)
[18] J.B.MacQueen,《多元观测分类和分析的一些方法》,载于:第五届伯克利数理统计与概率研讨会,第1卷,加利福尼亚大学出版社,伯克利,加利福尼亚州,1967年,第281-297页。;J.B.MacQueen,《多元观测分类和分析的一些方法》,载于:第五届伯克利数理统计与概率研讨会,第1卷,加利福尼亚大学出版社,伯克利,加利福尼亚州,1967年,第281-297页·兹比尔0214.46201
[19] Mayr,E。;Linsley,E.G。;Usinger,R.L.,《系统动物学的方法和原理》(1953年),麦格劳-希尔:麦格劳–希尔纽约
[20] Mirkin,B.,基于平方误差聚类的概念学习和特征选择,马赫。学习。,35, 25-40 (1999) ·Zbl 0920.68102号
[21] Mirkin,B.,《数据挖掘聚类》(2005),查普曼和霍尔:查普曼&霍尔博卡拉顿,佛罗里达州·Zbl 1083.68099号
[22] 罗维塔,S。;Masulli,F.,高维低基数数据聚类的共享最远邻方法,模式识别,39,12,2415-2425(2006)·Zbl 1103.68782号
[23] 斯内斯,P.H.A。;Sokal,R.R.,《数值分类学》(1973),弗里曼:英国伦敦弗里曼出版社·Zbl 0285.92001
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。