文件Zbl 1187.68388-zbMATH Open

PFHC：一种基于数据分区的聚类算法，用于不均匀分布的数据集。（英语） Zbl 1187.68388号

模糊集系统。 1601886-1901年第13号（2009年）.

摘要：近年来，许多研究人员致力于将聚类作为知识发现的主要数据挖掘方法，但很少有人关注不均匀数据集。在最后的研究中，我们提出了一种基于模糊图连通度的高效分层算法-FHC来发现具有任意形状的簇。本文提出了一种新的非均匀数据集聚类算法-PFHC，它是基于FHC的扩展版本。在PFHC中，首先根据分布的数据密度将数据集划分为多个局部空间，其中任何局部空间中的数据密度几乎是均匀的。为了实现这个目标，在每个局部域中使用局部\（\epsilon\）和\（\lambda\）来获得FHC的局部聚类结果。然后需要考虑局部区域之间的边界进行组合。最后，需要合并本地集群以获得全局集群。实验表明，PFHC作为FHC的一种扩展，能够更有效地处理不均匀数据集，生成质量更好的聚类。此外，PFHC也能在这项工作中处理增量数据。

MSC公司：

68T05型	人工智能中的学习和自适应系统
68吨10	模式识别、语音识别

关键词：

数据挖掘;模糊聚类;非均匀分布数据集;数据分区

软件：

群集查找;全氟辛烷值;P-FCM公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	阿格拉瓦尔，R。；Gehrke，J。；Gunoplos博士。；Raghavan，P.，《数据挖掘应用中高维数据的自动子空间聚类》（Proc.ACM-SIGMOD Internat.Conf.on Management of data（SIGMOD'98）。程序。ACM-SIGMOD国际。数据管理会议（SIGMOD'98），华盛顿特区（1998年6月），94-105
[2]	安科斯特，M。；Breunig，M。；Kriegel，H.-P。；Sander，J.，《OPTICS：确定聚类结构的排序点》（1999年ACM-SIGMOD Internat.Conf.on Management of Data（SIGMOD'99）（1999年6月）），第49-60页
[3]	Bezdek，J.C。；Hathaway，R.J.，《模糊c-均值的收敛理论：反例与修正》，IEEE系统、人与控制论汇刊，17，5，873-877（1987）·Zbl 0653.68091号
[4]	辛克，L。；弗莱斯蒂，G。；Lombardi，L.，图像分割的聚类模糊方法，模式识别，37，9，1797-1807（2004）·兹比尔1070.68655
[5]	Dong，Y。；庄，Y。；Chen，K。；Tai，X.，基于模糊图连通性的层次聚类算法，模糊集与系统，1571760-1774（2006）·Zbl 1100.68105号
[6]	埃斯特，M。；Kriegel，H.-P。；桑德，J。；Xu，X.，《在大型空间数据库中发现簇的基于密度的算法》（Proc.Internat.Conf.on Knowledge Discovery and Data Mining（KDD’96）（1996年8月））
[7]	德·卡瓦略，F.de A.T。；特诺里奥，C.P。；Cavalcanti，N.L.，基于自适应二次距离的分区模糊聚类方法，模糊集与系统，1572833-2857（2006）·Zbl 1103.68679号
[8]	Gasch，A.P。；Eisen，M.B.，《通过模糊k-均值聚类探索酵母基因表达的条件共同调节》，《基因组生物学》，3，11，1-22（2002）
[9]	Guha，S。；Rastogi，R。；Shim，K.，Cure:大型数据库的高效聚类算法（Proc.ACM-SIGMOD Conf.on Management of Data（SIGMOD'98）（1998年5月））·Zbl 1006.68661号
[10]	Han，J。；Kamber，M.，《数据挖掘：概念和技术》（2000），Morgan Kaufmann:Morgan Koufmann Los Altos
[11]	考夫曼，L。；Rousseeuw，P.J.，《在数据中发现群体：聚类分析导论》（1990），威利：威利纽约·Zbl 1345.62009号
[12]	Leski，J.M.，广义加权条件模糊聚类，IEEE模糊系统汇刊，11，6，709-715（2003）
[13]	Macqueen，J.，《多元观测分类和分析的一些方法》，（第五届伯克利数学统计与概率交响曲，第1卷（1967）），281-297·Zbl 0214.46201号
[14]	Nasibov，E.N。；Ulutagay，G.，《模糊聚类的一种新的无监督方法》，模糊集与系统，1582118-2133（2007）·Zbl 1416.62373号
[15]	诺克·R。；Nielsen，F.，关于加权聚类，IEEE模式分析和机器智能汇刊，28，8，1223-1235（2006）
[16]	佩德里茨，W。；Loia，V。；Senatore，S.，P-FCM：基于邻近性的模糊聚类，模糊集与系统，148，21-41（2004）·Zbl 1071.68541号
[17]	Runkler，T.A。；Bezdek，J.C.，交替聚类估计：聚类和函数近似的新工具，IEEE模糊系统汇刊，7，4，377-393（1999）
[18]	Sheikholeslami，G。；Chatterjee，S。；Zhang，A.，WaveCluster:一种用于超大空间数据库的多分辨率聚类方法，（Proc.24th very large databases Conf.（VLDB98）。程序。第24届超大数据库大会（VLDB98），纽约州纽约市（1998年）
[19]	Wang，W。；杨，J。；Muntz，R.，STING:空间数据挖掘的统计信息网格方法（Proc.1997 Internat.Conf.on Very large data Bases（VLDB’97）（1997年8月））
[20]	张，T。；罗摩克里希南，R。；Livny，M.，BIRCH：一种适用于超大数据库的高效数据聚类方法（Proc.ACM-SIGMOD Conf.on Management of data（SIGMOD'96）（1996年6月））

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

PFHC：一种基于数据分区的聚类算法，用于不均匀分布的数据集。（英语） Zbl 1187.68388号

MSC公司：

关键词：

软件：

参考文献：

示例

领域

操作员

PFHC：一种基于数据分区的聚类算法，用于不均匀分布的数据集。 （英语） Zbl 1187.68388号

MSC公司：

关键词：

软件：

参考文献：

PFHC：一种基于数据分区的聚类算法，用于不均匀分布的数据集。（英语） Zbl 1187.68388号