×

使用模糊局部聚类的增量密度聚类框架。 (英语) Zbl 1479.62043号

摘要:本文提出了一种新的基于密度的增量聚类框架,该框架使用一次通过方案,名为模糊增量密度聚类(FIDC)。与基于密度的聚类算法相比,FIDC采用一次处理并丢弃每个数据点的一次通过聚类算法,可以以更少的计算时间和内存处理大型数据集。在局部聚类分配过程中采用模糊局部聚类来减少单程聚类带来的聚类不一致性。为了提高聚类性能并简化参数选择过程,使用改进的山谷搜索算法自适应地确定离群阈值以生成最终聚类。FIDC可以在传统聚类和流数据聚类中运行。实验结果表明,FIDC在两种聚类模式下都优于最新的算法。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62小时86 多元分析与模糊性

软件:

KDD杯k均值++
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 奥庚,Y。;李,Q。;郑,R。;庄,F。;He,R。;Xiong,N.,Recome:一种新的基于密度的聚类算法,使用相对已知核密度,Inf.Sci。,436-437,13-30(2018),网址:http://www.sciencedirect.com/science/article/pii/S0020025518300215
[2] D.Arthur,S.Vassilvitskii,《K-means++:细心播种的优势》,摘自:第十八届ACM-SIAM离散算法年会论文集,SODA'07,工业与应用数学学会,美国宾夕法尼亚州费城,2007年。网址:http://dl.acm.org/citation.cfm?id=1283383.1283494。 ·Zbl 1190.68001号
[3] Bezdek,J.C.,模糊isodata聚类算法的收敛定理,IEEE Trans。模式分析。机器。智力。PAMI-2、1、1-8(1980)·Zbl 0441.62055号
[4] 坎佩罗,R.J.G.B。;Moulavi,D。;Zimek,A。;Sander,J.,数据聚类、可视化和离群值检测的层次密度估计,ACM Trans。知识。发现。数据,10,1,5:1-5:51(2015)
[5] F.Cao,M.Ester,W.Qian,A.Zhou,基于密度的噪声演化数据流聚类,载于:SIAM国际数据挖掘会议,2004年。
[6] 陈,Y。;Tu,L.,实时流数据的基于密度的聚类,(第13届ACM SIGKDD知识发现和数据挖掘国际会议论文集(2007))
[7] Demšar,J.,多数据集上分类器的统计比较,J.Mach。学习。研究,7,1-30(2006)·Zbl 1222.68184号
[8] 杜,M。;丁,S。;Jia,H.,基于k近邻和主成分分析的密度峰值聚类研究,Knowl-基于系统。,99,135-145(2016),网址:http://www.sciencedirect.com/science/article/pii/S0950705116000794
[9] 埃斯特,M。;Kriegel,H。;桑德,J。;Wimmer,M.,《数据仓库环境中用于挖掘的增量集群》,年,(第24届超大数据库国际会议论文集(1998年))
[10] 埃斯特,M。;Kriegel,H。;桑德,J。;Xu,X.,《在有噪声的大型空间数据库中发现簇的基于密度的算法》,年(第二届知识发现和数据挖掘国际会议(1996))
[11] 南卡罗来纳州加西亚。;费尔南德斯,A。;Luengo,J。;Herrera,F.,《计算智能和数据挖掘实验设计中多重比较的高级非参数检验:权力的实验分析》,《信息科学》。,180、10、2044-2064(2010),智能分布式信息系统专刊。网址:http://www.sciencedirect.com/science/article/pii/S0020025509005404
[12] Ghosh,A。;新南威尔士州米什拉。;Ghosh,S.,遥感图像中无监督变化检测的模糊聚类算法,Inf.Sci。,181、4、699-715(2011),网址:http://www.sciencedirect.com/science/article/pii/S0020025510005153
[13] 休伯特,L。;Arabie,P.,比较分区,J.Classif。,193-218年2月(1985年)
[14] 海德,R。;Angelov,P。;MacKenzie,A.,《将不断演变的数据流完全在线聚类为任意形状的簇》,《信息科学》。,382-38396-114(2017),网址:http://www.sciencedirect.com/science/article/pii/S0020025516319247
[15] Jain,A.,《数据聚类:超越k-means的50年》,模式识别。莱特。,31, 651-666 (2010)
[16] Karypis,G。;韩,E.-H.S。;库马尔,V.,《变色龙:使用动态建模的层次聚类》,《计算机》,32,8,68-75(1999)
[17] Laohakiat,S。;Phimoltares,S.公司。;Lursinsap,C.,《使用非计划数据删除进行流数据的超圆柱体微集群》,Knowl-基于系统。,99, 183-200 (2016)
[18] Laohakiat,S。;Phimoltares,S。;Lursinsap,C.,基于lda的无监督局部降维流数据聚类算法,Inf.Sci。,381, 104-123 (2017)
[19] 刘,R。;王,H。;Yu,X.,通过快速搜索和发现密度峰值,共享基于最近邻的聚类,Inform。科学。,850,C,200-226(2018)
[20] 曼宁,C。;Raghavan,P。;Schutze,H.,《信息检索导论》(2008),剑桥大学出版社:剑桥大学出版社,纽约·Zbl 1160.68008号
[21] Meng,Y。;尚,R。;Jiao,L。;张伟。;袁,Y。;Yang,S.,用于局部判别聚类的基于特征选择的对偶图稀疏非负矩阵分解,神经计算,29087-99(2018),URL:http://www.sciencedirect.com/science/article/pii/S09252231218301796
[22] J.Nayak,B.Naik,D.H.Behera,《模糊C均值(FCM)聚类算法:2000-2014年十年回顾》,2015年第32卷,第133-149页。
[23] Nguyen,X.V。;Bailey,J.,《聚类比较的信息论度量:变量、属性、归一化和机会修正》,J.Mach。学习。第11号决议,2837-2854(2010年)·Zbl 1242.62062号
[24] M.Peikari,S.Salama,S.Nofech-Mozes,A.Martel,病理图像分类的聚类半监督学习方法,科学。代表8。
[25] Rand,W.,《聚类方法评估的客观标准》,美国统计协会,66,846-850(1971)
[26] 罗德里格斯,A。;Laio,A.,《通过快速搜索和发现密度峰值进行聚类》,《科学》,34461911492-1496(2014),网址:https://science.sciencemag.org/content/344/6191/1492
[27] (Ross,T.J.;Booker,J.M.;Parkinson,W.J.,《模糊逻辑和概率应用:缩小差距》,工业和应用数学学会,宾夕法尼亚州费城,美国(2002))·Zbl 1005.00012
[28] Shang,R。;田,P。;Jiao,L。;斯托尔金,R。;冯,J。;侯,B。;Zhang,X.,一种用于sar图像分割的基于免疫克隆的核度量空间模糊聚类算法,IEEE J.Selected Top。申请。地球观测站。遥感,9,4,1640-1652(2016)
[29] Shang,R。;Wang,W。;斯托尔金,R。;Jiao,L.,基于子空间学习的图正则化特征选择,Knowl-基于系统。,112152-165(2016),网址:http://www.sciencedirect.com/science/article/pii/S0950705116303227
[30] Shang,R。;Xu,K。;尚,F。;Jiao,L.,基于稀疏和低冗余子空间学习的双粒度正则化稳健特征选择,Knowl-基于系统。,187,第104830条pp.(2020),网址:http://www.sciencedirect.com/science/article/pii/S0950705119303053
[31] Shang,R。;张,Z。;Jiao,L。;Wang,W。;Yang,S.,基于全局判别的非负谱聚类,模式识别。,55,C,172-182(2016)·Zbl 1412.62085号
[32] M.Tavallaee、E.Bagheri、W.Lu、A.A.Ghorbani,《kdd cup 99数据集的详细分析》,载于《第二届IEEE安全与防御应用计算智能国际会议论文集》,CISDA'09年,IEEE出版社,美国新泽西州皮斯卡塔韦,2009年。
[33] 西奥多里迪斯,S。;Koutroumbas,K.,《模式识别》,第四版(2008),学术出版社:美国佛罗里达州奥兰多市学术出版社
[34] 田,D。;龚,M.,一种用于sar图像变化检测的基于边缘权重的新型模糊聚类方法,Inf.Sci。,467,415-430(2018),网址:http://www.sciencedirect.com/science/article/pii/S0020025518306200 ·兹比尔1441.94025
[35] 谢军。;高,H。;谢伟。;刘,X。;Grant,P.W.,通过检测密度峰值和基于模糊加权k最近邻分配点的鲁棒聚类,Inf.Sci。,354,19-40(2016),网址:http://www.sciencedirect.com/science/article/pii/S002002551630158X
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。