×

PFHC:一种基于数据分区的聚类算法,用于不均匀分布的数据集。 (英语) Zbl 1187.68388号

摘要:近年来,许多研究人员致力于将聚类作为知识发现的主要数据挖掘方法,但很少有人关注不均匀数据集。在最后的研究中,我们提出了一种基于模糊图连通度的高效分层算法-FHC来发现具有任意形状的簇。本文提出了一种新的非均匀数据集聚类算法-PFHC,它是基于FHC的扩展版本。在PFHC中,首先根据分布的数据密度将数据集划分为多个局部空间,其中任何局部空间中的数据密度几乎是均匀的。为了实现这个目标,在每个局部域中使用局部\(\epsilon\)和\(\lambda\)来获得FHC的局部聚类结果。然后需要考虑局部区域之间的边界进行组合。最后,需要合并本地集群以获得全局集群。实验表明,PFHC作为FHC的一种扩展,能够更有效地处理不均匀数据集,生成质量更好的聚类。此外,PFHC也能在这项工作中处理增量数据。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 阿格拉瓦尔,R。;Gehrke,J。;Gunoplos博士。;Raghavan,P.,《数据挖掘应用中高维数据的自动子空间聚类》(Proc.ACM-SIGMOD Internat.Conf.on Management of data(SIGMOD'98)。程序。ACM-SIGMOD国际。数据管理会议(SIGMOD'98),华盛顿特区(1998年6月),94-105
[2] 安科斯特,M。;Breunig,M。;Kriegel,H.-P。;Sander,J.,《OPTICS:确定聚类结构的排序点》(1999年ACM-SIGMOD Internat.Conf.on Management of Data(SIGMOD'99)(1999年6月)),第49-60页
[3] Bezdek,J.C。;Hathaway,R.J.,《模糊c-均值的收敛理论:反例与修正》,IEEE系统、人与控制论汇刊,17,5,873-877(1987)·Zbl 0653.68091号
[4] 辛克,L。;弗莱斯蒂,G。;Lombardi,L.,图像分割的聚类模糊方法,模式识别,37,9,1797-1807(2004)·兹比尔1070.68655
[5] Dong,Y。;庄,Y。;Chen,K。;Tai,X.,基于模糊图连通性的层次聚类算法,模糊集与系统,1571760-1774(2006)·Zbl 1100.68105号
[6] 埃斯特,M。;Kriegel,H.-P。;桑德,J。;Xu,X.,《在大型空间数据库中发现簇的基于密度的算法》(Proc.Internat.Conf.on Knowledge Discovery and Data Mining(KDD’96)(1996年8月))
[7] 德·卡瓦略,F.de A.T。;特诺里奥,C.P。;Cavalcanti,N.L.,基于自适应二次距离的分区模糊聚类方法,模糊集与系统,1572833-2857(2006)·Zbl 1103.68679号
[8] Gasch,A.P。;Eisen,M.B.,《通过模糊k-均值聚类探索酵母基因表达的条件共同调节》,《基因组生物学》,3,11,1-22(2002)
[9] Guha,S。;Rastogi,R。;Shim,K.,Cure:大型数据库的高效聚类算法(Proc.ACM-SIGMOD Conf.on Management of Data(SIGMOD'98)(1998年5月))·Zbl 1006.68661号
[10] Han,J。;Kamber,M.,《数据挖掘:概念和技术》(2000),Morgan Kaufmann:Morgan Koufmann Los Altos
[11] 考夫曼,L。;Rousseeuw,P.J.,《在数据中发现群体:聚类分析导论》(1990),威利:威利纽约·Zbl 1345.62009号
[12] Leski,J.M.,广义加权条件模糊聚类,IEEE模糊系统汇刊,11,6,709-715(2003)
[13] Macqueen,J.,《多元观测分类和分析的一些方法》,(第五届伯克利数学统计与概率交响曲,第1卷(1967)),281-297·Zbl 0214.46201号
[14] Nasibov,E.N。;Ulutagay,G.,《模糊聚类的一种新的无监督方法》,模糊集与系统,1582118-2133(2007)·Zbl 1416.62373号
[15] 诺克·R。;Nielsen,F.,关于加权聚类,IEEE模式分析和机器智能汇刊,28,8,1223-1235(2006)
[16] 佩德里茨,W。;Loia,V。;Senatore,S.,P-FCM:基于邻近性的模糊聚类,模糊集与系统,148,21-41(2004)·Zbl 1071.68541号
[17] Runkler,T.A。;Bezdek,J.C.,交替聚类估计:聚类和函数近似的新工具,IEEE模糊系统汇刊,7,4,377-393(1999)
[18] Sheikholeslami,G。;Chatterjee,S。;Zhang,A.,WaveCluster:一种用于超大空间数据库的多分辨率聚类方法,(Proc.24th very large databases Conf.(VLDB98)。程序。第24届超大数据库大会(VLDB98),纽约州纽约市(1998年)
[19] Wang,W。;杨,J。;Muntz,R.,STING:空间数据挖掘的统计信息网格方法(Proc.1997 Internat.Conf.on Very large data Bases(VLDB’97)(1997年8月))
[20] 张,T。;罗摩克里希南,R。;Livny,M.,BIRCH:一种适用于超大数据库的高效数据聚类方法(Proc.ACM-SIGMOD Conf.on Management of data(SIGMOD'96)(1996年6月))
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。