×

具有不同邻域关系的基于密度的聚类方法的稳健性。 (英语) Zbl 1185.68555号

摘要:聚类分析是统计数据分析中最关键的技术之一。在聚类方法中,基于密度的方法因其能够识别任意形状的簇而具有重要意义。本文讨论了聚类方法的鲁棒性。这些方法使用点之间基于距离的邻域关系。特别地,分析了DBSCAN(带噪声应用的基于密度的空间聚类)算法和FN-DBSCAN算法(模糊邻域DBSCAN)。FN-DBSCAN算法使用模糊邻域关系,而DBSCAN使用清晰邻域关系。FN-DBSCAN算法的主要特点是它结合了DBSCAN的速度和NRFJP(噪声鲁棒模糊关节点)算法的鲁棒性。观察到,FN-DBSCAN算法对各种形状和密度的数据集比DBSCAN算法更具鲁棒性。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 亚伯拉罕·T。;Roddick,J.F.,《时空数据库调查》,GeoInformatica,3,1,61-99(1999)
[2] M.Ankerst,M.M.Breunig,H.-P.Kriegel,J.Sander,《OPTICS:识别聚类结构的排序点》,摘自:Proc。ACM SIGMOD内部。数据管理会议,宾夕法尼亚州费城,1999年,第49-60页。;M.Ankerst,M.M.Breunig,H.-P.Kriegel,J.Sander,《OPTICS:识别聚类结构的排序点》,摘自:Proc。ACM SIGMOD国际。数据管理会议,宾夕法尼亚州费城,1999年,第49-60页。
[3] 奥英,Z。;水耕,Z.,将DBSCAN算法扩展到大型空间数据库的方法,计算机科学与技术杂志,15,6,509-526(2000)·Zbl 0970.68583号
[4] Bensaid,上午。;洛杉矶霍尔。;Bezdek,J.C。;克拉克,L.P。;Silbiger,M.L。;阿灵顿,J.A。;Murtagh,R.F.,有效引导(重新)聚类及其在图像分割中的应用,IEEE模糊系统汇刊,4,2,112-123(1996)
[5] 比兰特,D。;Kut,A.,ST-DBSCAN:一种对时空数据进行聚类的算法,数据与知识工程,60208-221(2007)
[6] Dong,Y。;庄,Y。;Chen,K。;Tai,X.,基于模糊图连通性的层次聚类算法,模糊集与系统,1571760-1774(2006)·Zbl 1100.68105号
[7] 段,L。;徐,L。;郭,F。;Lee,J。;Yan,B.,一种基于局部密度的带噪声空间聚类算法,信息系统,32978-986(2007)
[8] Dunn,J.C.,ISODATA过程的模糊关系及其在检测紧密且分离良好的星团中的应用,《控制论杂志》,3,3,32-57(1973)·Zbl 0291.68033号
[9] M.Ester,H.P.Kriegel,J.Sander,X.Xu,一种基于密度的算法,用于在带有噪声的大型空间数据库中发现簇,见:Proc。第二国际。知识发现和数据挖掘会议,1996年,第226-231页。;M.Ester,H.P.Kriegel,J.Sander,X.Xu,一种基于密度的算法,用于在带有噪声的大型空间数据库中发现簇,见:Proc。第二国际。知识发现和数据挖掘会议,1996年,第226-231页。
[10] S.Guha,R.Rastogi,K.Shim,《CURE:大型数据库的高效聚类算法》,摘自:Proc。ACM SIGMOD国际。数据管理会议,华盛顿州西雅图,1998年,第73-84页。;S.Guha,R.Rastogi,K.Shim,《CURE:大型数据库的高效聚类算法》,摘自:Proc。ACM SIGMOD国际。《数据管理会议》,西雅图,华盛顿州,1998年,第73-84页·Zbl 1006.68661号
[11] 哈马·R·E。;Curran,J.H.,《关于节理数据模糊K均值算法的距离度量》,《岩石力学与岩石工程》,32,1,1-27(1999)
[12] J.Han,M.Kamber,《数据挖掘概念和技术》,Morgan Kaufmann出版社,加利福尼亚州旧金山,2001年,第335-391页。;J.Han,M.Kamber,《数据挖掘概念和技术》,摩根·考夫曼出版社,加利福尼亚州旧金山,2001年,第335-391页。
[13] Han,J。;M.Kamber。;Tung,A.K.H.,《数据挖掘中的空间聚类方法:调查》(Miller,H.;Han,J.,《地理数据挖掘和知识发现》(2001),Taylor&Francis:Taylor和Francis London)
[14] H.-P.Kriegel,K.Kailing,A.Pryakin,M.,Schubert,《用噪声聚类多表示对象》,PAKDD,2004年,第394-403页。;H.-P.Kriegel,K.Kailing,A.Pryakin,M.,Schubert,《用噪声聚类多表示对象》,PAKDD,2004年,第394-403页。
[15] H.-P.Kriegel,M.Pfeiffe,基于密度的不确定数据聚类,在:Proc。第11届ACM SIGKDD国际。数据挖掘中的知识发现会议,2005年,第672-677页。;H.-P.Kriegel,M.Pfeifle,《基于密度的不确定数据聚类》,摘自:Proc。第11届ACM SIGKDD国际。《数据挖掘中的知识发现》,2005年,第672-677页。
[16] E.N.Nasibov,《聚类分析的另一种模糊层次方法》,摘自:Proc。第七国际。《模糊系统和软计算应用大会》,德国西根,2006年,第113-123页。;E.N.Nasibov,《聚类分析的另一种模糊层次方法》,摘自:Proc。第七国际。《模糊系统和软计算应用大会》,德国西根,2006年,第113-123页。
[17] Nasibov,E.N.,基于模糊联合点方法的模糊聚类问题鲁棒算法,控制论与系统分析,44,1(2008)·兹比尔1181.68253
[18] Nasibov,E.N。;Ulutagay,G.,《模糊聚类的一种新的无监督方法》,模糊集与系统,1582118-2133(2007)·Zbl 1416.62373号
[19] Nasibov,E.N。;Ulutagay,G.,《使用模糊连接点方法解决聚类问题的新方法》,《自动控制与计算机科学》,39,6,8-17(2005)
[20] Nasibov,E.N。;Ulutagay,G.,《关于模糊聚类问题的模糊结合点方法》,《自动控制与计算机科学》,40,5,33-44(2006)
[21] 北卡罗来纳州帕尔。;Bezdek,J.C.,关于模糊C-均值模型的聚类有效性,IEEE模糊系统汇刊,3,3,370-379(1995)
[22] 佩德里茨,W。;Gomide,F.,《模糊集导论》(1998),麻省理工学院
[23] M.Sadaaki,Y.Endo,S.Hayakawa,E.Kataoka,基于模糊邻域系统的信息对象分类和聚类,收录于:IEEE Internat。《系统、人与控制论大会》,夏威夷,2005年,第3210-3215页。;M.Sadaaki,Y.Endo,S.Hayakawa,E.Kataoka,基于模糊邻域系统的信息对象分类和聚类,收录于:IEEE Internat。《系统、人与控制论会议》,夏威夷,2005年,第3210-3215页。
[24] Samet,H.,《空间数据结构的设计与分析》(1990年),艾迪森·韦斯利:艾迪森·韦斯利阅读,马萨诸塞州
[25] 桑德,J。;埃斯特,M。;Kriegel,H.P。;Xu,X.,空间数据库中基于密度的聚类:算法GDBSCAN及其应用,数据挖掘和知识发现,2169-194(1998)
[26] Velthuizen,R.P。;洛杉矶霍尔。;克拉克,L.P。;Silbiger,M.L.,大数据集山地方法聚类研究,模式识别,30,7,1121-1135(1997)
[27] Yager,R.R。;Filev,D.P.,通过山方法进行近似聚类,IEEE系统、人与控制论汇刊,24,8,1279-1284(1994)
[28] 北卡罗来纳州扎希德。;O.Abouelala。;利穆里,M。;Essaid,A.,基于K近邻规则的模糊聚类,模糊集与系统,120239-247(2001)·Zbl 0981.62057号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。