×

非线性可分数据(模糊)聚类的回顾与建议。 (英语) Zbl 1471.62566

摘要:在许多实际情况下,数据可能具有非线性可分簇的特征。经典的(硬或模糊)聚类算法通过计算欧几里德距离来划分对象。因此,它们基于线性假设,因此无法正确识别具有非线性结构特征的团簇。为了克服这种局限性,可以采用几种方法:基于密度、核、图或流形的聚类。对这些方法进行了综述,并提出了一些新的基于模糊流形的聚类算法,其中包括测地线距离。综合数据、基准数据和实际数据表明了该算法的有效性。

理学硕士:

62R30 流形统计量
H3620小时 分类和区分;聚类分析(统计方面)
86小时62分 多元分析与模糊性
PDF格式 BibTeX公司 XML 引用
全文: 内政部

参考文献:

[1] MacQueen,J.B.,《多元观测的分类和分析的一些方法》,《第五届伯克利数理统计与概率研讨会论文集》(1967年),加州大学出版社:加州大学出版社,第281-297页
[2] 《模糊目标函数算法的模式识别》(1981),Plenum出版社:纽约·Zbl 0503.68069
[3] 古斯塔夫森特区。;Kessel,W.C.,模糊协方差矩阵的模糊聚类(1978年IEEE决策与控制会议论文集,包括第17届自适应过程研讨会(1979)),761-766
[4] 盖特一世。;无监督最优模糊聚类,IEEE Trans。肛门模式。机器。内尔。,7773-781(1989年)·Zbl 0709.62592
[5] 酯,M。;Kriegel,H.P。;约格,S。;徐X,一种基于密度的带噪声大空间数据库聚类算法(第二届知识发现与数据挖掘国际会议论文集KDD'96(1996),AAAI出版社:AAAI出版社,第226-231页
[6] 肖伊·泰勒,J。;《模式分析的核心方法》(2004),剑桥大学出版社:剑桥大学出版社
[7] 迪隆,I.S。;关,Y。;Kulis,B.,《核心k-均值:谱聚类和归一化割集》,《第十届ACM-SIKDD国际知识发现和数据挖掘会议论文集》,KDD'04(2004),ACM:ACM纽约,551-556
[8] Ng,A。;约旦,M。;Weiss,Y.,关于光谱聚类:分析和算法,(Dieterich,T.;Becker,S.;Ghahramani,Z.,《神经信息处理系统的进展》,第14卷(2002年),麻省理工学院出版社:麻省理工学院出版社),849-856
[9] 阿斯格尔贝吉,N。;Maleki,A.,测地k-均值聚类(2008年第19届国际模式识别会议论文集,佛罗里达州坦帕(2008)),1-4
[10] 斯坦福大学。;Raftery,A.E.,在空间点模式中寻找曲线特征:带噪声的主曲线聚类,IEEE Trans。肛门模式。机器。内尔。,22601-609(2000年)
[11] 坎佩罗,R.J.G.B。;穆拉维,D。;齐梅克,A。;Sander,J.,数据聚类、可视化和离群点检测的分层密度估计,ACM Trans。知道。迪斯科舞厅。数据,10,1-51(2015)
[12] 交通部。;单调,K。;Daszykowski,M.,修正的DBSCAN算法,用密集的相邻簇对数据进行聚类,Chemom。因特尔。实验室系统。,12092-96(2013年)
[13] 汉,D。;阿格拉瓦尔,A。;廖文凯。;Choudhary,A.,带有spark实现的快速DBSCAN算法,(Roy,S.S.;Samui,P.;Deo,R.;Ntalampiras,S.,工程应用中的大数据(2018),Springer:Springer Singapore),173-192
[14] 周,A。;周,S。;曹,J。;风扇,Y。;Hu,Y.将DBSCAN算法扩展到大型空间数据库的方法,J.Comput。科学。技术。,15509-526(2000年)·Zbl 0970.68583
[15] 安克斯特,M。;布鲁尼,医学硕士。;Kriegel,H.P。;Sander,J.,《光学:确定聚类结构的排序点》,《ACM SIGMOD数据管理国际会议论文集》(1999年),ACM:ACM纽约,49-60
[16] 哈斯勒,M。;皮肯布鲁克,M。;雅利安,S。;Mount,D.,dbscan:基于密度的带噪应用程序聚类(dbscan)和相关算法。R包版本1.1-3(2018)
[17] Hennig,C.,fpc:灵活的聚类过程。R包版本2.1-11.1(2018)
[18] 埃格,克里普。;克鲁格,P。;桑德,J。;Zimek,A.,基于密度的聚类,Wiley Interdiscip。最小已知修订数据。迪斯科舞厅。,1231-240(2011年)
[19] Sander,J.,《基于密度的聚类》(Sammut,C.;Webb,G.I.,《机器学习和数据挖掘百科全书》(2016),Springer:Springer Boston),1-5
[20] 桑德,J。;酯,M。;Kriegel,H.P。;许小X,空间数据库中基于密度的聚类:GDBSCAN算法及其应用,数据最小知识。迪斯科舞厅。,2199-194年(1998年)
[21] 舒伯特E。;桑德,J。;酯,M。;Kriegel,H.P。;Xu,X.,DBSCAN重温,重温:为什么和如何使用DBSCAN,ACM Trans。数据库系统。,第42、19期(2017年)
[22] 纳西波娃,东印度。;吴建杰,等,不同邻域关系下基于密度聚类方法的鲁棒性,模糊集系统。,1603601-3615(2009年)·Zbl 1185.68555
[23] 博尔多格纳,G。;Ienco,D.,模糊核心dbscan聚类算法,(Laurent,A.;Strauss,O.;Bouchon Meunier,B.;Yager,R.R.《基于知识的系统中不确定性的信息处理和管理》《基于知识的系统中不确定性的信息处理和管理》,IPMU 2014。知识系统中不确定性的信息处理和管理。知识系统中不确定性的信息处理和管理,IPMU 2014,计算机与信息科学通信,第442卷(2014),Springer:Springer-Cham),100-109
[24] 恩西奥,D。;博多格纳,G.,DBScan聚类算法的模糊扩展,软计算。,1719-1730年(2018年)·Zbl 1398.62165
[25] 乌卢塔加亚,G。;Nasibov,E.,基于邻域概念的模糊和清晰聚类方法:综合评述,J.Intell。模糊系统。,2012年1月23日至11日
[26] 克里斯蒂亚尼,N。;《支持向量机及其他基于核的学习方法导论》(2000),剑桥大学出版社:剑桥大学出版社
[27] 卡拉佐格鲁,A。;斯莫拉,A。;霍尼克,K。;Zeileis,A.,kernlab:R,J.Stat.Softw.中内核方法的S4包。,11、9、1-20(2004年)
[28] 张博士。;陈,S.C.,使用基于核的模糊C-均值算法对不完全数据进行聚类,神经过程。利特。,1855-162(2003年)
[29] 张博士。;陈,S.C.,一种新的核化模糊C-均值算法及其在医学图像分割中的应用。因特尔。医学,32,37-50(2004)
[30] 丁,Y。;Fu,X.,基于遗传算法的基于核的模糊c-均值聚类算法,神经计算,188233-238(2016)
[31] 莫蒙,K.H。;李德赫,具局部信息的广义核加权模糊C-均值聚类算法,模糊集系统。,34091-108(2018年)·Zbl 1397.62226
[32] 谢弗,S.E.,图聚类,计算机。科学。第1版,第27-64页(2007年)·Zbl 1302.68237号
[33] 美国,卢森堡,光谱聚类教程,Stat.Comput。,17395-416(2007年)
[34] 施,J。;Malik,J.,规范化切割和图像分割,IEEE Trans。肛门模式。机器。内尔。,22888-905(2000年)
[35] Zahn,C.T.,检测和描述格式塔簇的图论方法,IEEE Trans。计算机。,第20、68-86页(1971年)·Zbl 0264.68040
[36] 奥克萨南,J。;布兰切特,F.G。;友好,M。;金特,R。;勒让德,P。;麦克林博士。;中华人民共和国明钦。;奥哈拉,R.B。;辛普森,G.L。;索利莫斯,P。;史蒂文斯,M.H.H。;Szoecs,E。;社区生态学,瓦格纳包。R包版本2.5-4(2019年)
[37] 沙兰,R。;Shamir,R.,CLICK:聚类算法及其在基因表达分析中的应用(第八届分子生物学智能系统国际会议论文集ISMB'00(2000),AAAI出版社:AAAI出版社Menlo Park),307-316
[38] Dijkstra,E.W.,《关于与图有关的两个问题的注记》,Numer。数学。,1269-271年(1959年)·Zbl 0092.16002
[39] Floyd,R.W.,算法97:最短路径,公社。ACM,5345(1962年)
[40] 《布尔矩阵定理》,J.ACM,9,11-12(1962)·京保0118.33104
[41] 特南鲍姆,J.B。;德席尔瓦,V。;Langford,J.C.,非线性降维的全球几何框架,科学,2902319-2323(2000)
[42] 李,J.A。;Verleysen,M.,非线性降维(2007),Springer Verlag:Springer Verlag纽约·Zbl 1128.68024
[43] 阿斯格尔贝吉,N。;Maleki,A.,测地k-均值聚类(2008年第19届国际模式识别会议论文集(2008)),1-4
[44] 考夫曼,L。;Rousseeuw,P.J.,Medoid聚类法,(Dodge,Y.,基于L1范数和相关方法的统计数据分析(1987),北荷兰:北荷兰阿姆斯特丹),405-416
[45] 考夫曼,L。;罗素,P.J.,《在数据中寻找群体:聚类分析导论》(1990),约翰威利和儿子:约翰威利和儿子霍博肯·Zbl 1345.62009
[46] 吴,A.Y。;加兰,M。;Han,J.,使用测地聚类挖掘无标度网络,(第十届ACM SIGKDD国际知识发现和数据挖掘会议论文集KDD'04(2004),ACM:ACM纽约),719-724
[47] 雷,S。;Pakhira,M.K.,《使用K-medoid框架的无标度网络聚类》,《第二届计算机和通信技术国际会议论文集》,2011年第94-99页
[48] Karygianni,S。;Frossard,P.,局部线性模型的切线流形逼近,信号处理。,104232-247(2014年)
[49] 巴贝语,A。;巴贝,M。;贝耶斯特塔什克,A。;Bandarabadi,M.,使用曲率约束距离的非线性子空间聚类,模式识别。利特。,68118-125(2015年)
[50] 费尔,B。;Abonyi,J.,基于测地距离的模糊聚类,(Saad,A.;Dahal,K.;Sarfraz,M.;Roy,R.,《工业应用中的软计算》。软计算进展,第39卷(2007年),Springer:Springer-Heidelberg),50-59·中银05218151
[51] 博格,I。;Groenen,P.,现代多维标度:理论与应用(2005),Springer Verlag:Springer Verlag纽约·Zbl 1085.62079
[52] 巴拉苏布拉曼尼亚,M。;施瓦茨,E.L。;特南鲍姆,J.B。;德席尔瓦,V。;Langford,J.C.,Isomap算法和拓扑稳定性,科学,2955552,7(2002)
[53] 克里希纳普拉姆,R。;乔希,A。;Yi,L.,k-medoids算法的模糊关系及其在web文档和片段聚类中的应用(FUZZ-IEEE’99(1999)模糊系统会议论文集),1281-1286
[54] 基拉利,A。;瓦蒂·福加拉西,Á。;李志明,等.基于测地距离的模糊c-中面聚类-图和高维数据中心点的搜索,模糊集系统。,286157-172(2016年)
[55] 金,J。;垫片,K.H。;Choi,S.,软测地线核k-means,(2007年IEEE声学、语音和信号处理国际会议论文集),429-432
[56] Runkler,T.A.,关系模糊聚类(de Oliveira,J.V.;Pedrycz,W.,《模糊聚类及其应用进展》(2007年),Wiley:Wiley-Chichester),31-51
[57] 乔达尼,P。;胡志明,A.B.,随机模糊集的模糊聚类过程,模糊集系统。,305,54-69(2016年)·Zbl 1368.62175
[58] 班纳吉,A。;Davé,R.N.,鲁棒聚类,Wiley Interdiscip。最小已知修订数据。迪斯科舞厅。,2,29-59(2011年)
[59] Davé,R.N.,聚类中噪声的特征和检测,模式识别。利特。,12657-664(1991年)
[60] 达维,R.N。;《关系数据的鲁棒模糊聚类》,IEEE Trans。模糊系统。,10713-727(2002年)
[61] 费拉罗,医学学士。;乔丹尼,P.,《使用R语言进行模糊聚类的工具箱》,《模糊集系统》。,2015年11月16日
[62] 费拉罗,医学学士。;乔达尼,P。;Serafini,A.,fclust:模糊聚类的R包,R J.,9(2019)
[63] 酒后驾车。;Graff,C.,UCI机器学习知识库(2019年),加利福尼亚大学信息与计算机科学学院:加利福尼亚大学信息与计算机科学学院欧文分校
[64] 休伯特,L。;Arabie,P.,比较分区,J.Classif。,2193-218年(1985年)
〔65〕 (2017),(意大利语)
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。