董一红;曹绍卡;陈,肯;何茂顺;泰晓英 PFHC:一种基于数据分区的聚类算法,用于不均匀分布的数据集。 (英语) Zbl 1187.68388号 模糊集系统。 1601886-1901年第13号(2009年). 摘要:近年来,许多研究人员致力于将聚类作为知识发现的主要数据挖掘方法,但很少有人关注不均匀数据集。在最后的研究中,我们提出了一种基于模糊图连通度的高效分层算法-FHC来发现具有任意形状的簇。本文提出了一种新的非均匀数据集聚类算法-PFHC,它是基于FHC的扩展版本。在PFHC中,首先根据分布的数据密度将数据集划分为多个局部空间,其中任何局部空间中的数据密度几乎是均匀的。为了实现这个目标,在每个局部域中使用局部\(\epsilon\)和\(\lambda\)来获得FHC的局部聚类结果。然后需要考虑局部区域之间的边界进行组合。最后,需要合并本地集群以获得全局集群。实验表明,PFHC作为FHC的一种扩展,能够更有效地处理不均匀数据集,生成质量更好的聚类。此外,PFHC也能在这项工作中处理增量数据。 MSC公司: 68T05型 人工智能中的学习和自适应系统 68吨10 模式识别、语音识别 关键词:数据挖掘;模糊聚类;非均匀分布数据集;数据分区 软件:群集查找;全氟辛烷值;P-FCM公司 PDF格式BibTeX公司 XML格式引用 \textit{Y.Dong}等人,《模糊集系统》。160,第13号,1886--1901(2009;Zbl 1187.68388) 全文: 内政部 参考文献: [1] 阿格拉瓦尔,R。;Gehrke,J。;Gunoplos博士。;Raghavan,P.,《数据挖掘应用中高维数据的自动子空间聚类》(Proc.ACM-SIGMOD Internat.Conf.on Management of data(SIGMOD'98)。程序。ACM-SIGMOD国际。数据管理会议(SIGMOD'98),华盛顿特区(1998年6月),94-105 [2] 安科斯特,M。;Breunig,M。;Kriegel,H.-P。;Sander,J.,《OPTICS:确定聚类结构的排序点》(1999年ACM-SIGMOD Internat.Conf.on Management of Data(SIGMOD'99)(1999年6月)),第49-60页 [3] Bezdek,J.C。;Hathaway,R.J.,《模糊c-均值的收敛理论:反例与修正》,IEEE系统、人与控制论汇刊,17,5,873-877(1987)·Zbl 0653.68091号 [4] 辛克,L。;弗莱斯蒂,G。;Lombardi,L.,图像分割的聚类模糊方法,模式识别,37,9,1797-1807(2004)·兹比尔1070.68655 [5] Dong,Y。;庄,Y。;Chen,K。;Tai,X.,基于模糊图连通性的层次聚类算法,模糊集与系统,1571760-1774(2006)·Zbl 1100.68105号 [6] 埃斯特,M。;Kriegel,H.-P。;桑德,J。;Xu,X.,《在大型空间数据库中发现簇的基于密度的算法》(Proc.Internat.Conf.on Knowledge Discovery and Data Mining(KDD’96)(1996年8月)) [7] 德·卡瓦略,F.de A.T。;特诺里奥,C.P。;Cavalcanti,N.L.,基于自适应二次距离的分区模糊聚类方法,模糊集与系统,1572833-2857(2006)·Zbl 1103.68679号 [8] Gasch,A.P。;Eisen,M.B.,《通过模糊k-均值聚类探索酵母基因表达的条件共同调节》,《基因组生物学》,3,11,1-22(2002) [9] Guha,S。;Rastogi,R。;Shim,K.,Cure:大型数据库的高效聚类算法(Proc.ACM-SIGMOD Conf.on Management of Data(SIGMOD'98)(1998年5月))·Zbl 1006.68661号 [10] Han,J。;Kamber,M.,《数据挖掘:概念和技术》(2000),Morgan Kaufmann:Morgan Koufmann Los Altos [11] 考夫曼,L。;Rousseeuw,P.J.,《在数据中发现群体:聚类分析导论》(1990),威利:威利纽约·Zbl 1345.62009号 [12] Leski,J.M.,广义加权条件模糊聚类,IEEE模糊系统汇刊,11,6,709-715(2003) [13] Macqueen,J.,《多元观测分类和分析的一些方法》,(第五届伯克利数学统计与概率交响曲,第1卷(1967)),281-297·Zbl 0214.46201号 [14] Nasibov,E.N。;Ulutagay,G.,《模糊聚类的一种新的无监督方法》,模糊集与系统,1582118-2133(2007)·Zbl 1416.62373号 [15] 诺克·R。;Nielsen,F.,关于加权聚类,IEEE模式分析和机器智能汇刊,28,8,1223-1235(2006) [16] 佩德里茨,W。;Loia,V。;Senatore,S.,P-FCM:基于邻近性的模糊聚类,模糊集与系统,148,21-41(2004)·Zbl 1071.68541号 [17] Runkler,T.A。;Bezdek,J.C.,交替聚类估计:聚类和函数近似的新工具,IEEE模糊系统汇刊,7,4,377-393(1999) [18] Sheikholeslami,G。;Chatterjee,S。;Zhang,A.,WaveCluster:一种用于超大空间数据库的多分辨率聚类方法,(Proc.24th very large databases Conf.(VLDB98)。程序。第24届超大数据库大会(VLDB98),纽约州纽约市(1998年) [19] Wang,W。;杨,J。;Muntz,R.,STING:空间数据挖掘的统计信息网格方法(Proc.1997 Internat.Conf.on Very large data Bases(VLDB’97)(1997年8月)) [20] 张,T。;罗摩克里希南,R。;Livny,M.,BIRCH:一种适用于超大数据库的高效数据聚类方法(Proc.ACM-SIGMOD Conf.on Management of data(SIGMOD'96)(1996年6月)) 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。