×

鲁棒约束模糊聚类。 (英语) Zbl 1321.62070号

摘要:众所周知,在应用聚类方法时,异常值和噪声数据可能非常有害。已经提出了几种能够处理噪声存在的模糊聚类方法。在这项工作中,我们提出了一种称为F-TCLUST的稳健聚类方法,该方法基于修剪由数据集本身(“公平”)确定的固定比例的观测值。所提出的方法还考虑了特征值比约束,这使其成为一个数学上定义良好的问题,并用于控制簇散射之间允许的差异。针对其实际实现,提出了一种计算上可行的算法。文中还对如何选择控制模糊聚类过程性能的参数给出了一些指导。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62时86分 多元分析与模糊性
62层35 鲁棒性和自适应程序(参数推断)

软件:

TCLUST公司
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Banerjee,A。;Davé,R.N.,稳健聚类,WIRE数据挖掘和知识发现,229-59(2012)
[2] 巴尼,M。;卡佩里尼,V。;Mecocci,A.,《关于聚类可能性方法的评论》,IEEE模糊系统汇刊,4393-396(1996)
[3] Bezdek,J.C.,《模糊目标函数算法的模式识别》(1981),Plenum出版社:纽约Plenum Press·Zbl 0503.68069号
[7] Davé,R.N.,《聚类中噪声的表征和检测》,《模式识别快报》,12657-664(1991)
[8] Davé,R.N。;Krishnapuram,R.,《稳健聚类方法:统一观点》,IEEE模糊系统事务,5270-293(1997)
[10] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,《通过EM算法从不完整数据中获取最大似然》,《皇家统计学会杂志》,B辑,39,138(1977)·Zbl 0364.62022号
[11] Dunn,J.C.,ISODATA过程的模糊关系及其在检测紧密且分离良好的星团中的应用,《控制论杂志》,3,32-57(1974)·Zbl 0291.68033号
[12] D’Urso,P.,具有内点和外点时间轨迹的数据时间阵列的模糊聚类,IEEE模糊系统汇刊,13583-604(2005)
[13] Flury,B。;Riedwyl,H.,多元统计。多元统计,实用方法(1988),查普曼和霍尔:查普曼与霍尔伦敦-纽约
[15] 加列戈斯,M。;Ritter,G.,《聚类受污染分组数据的修剪算法及其稳健性》,《数据分析和分类进展》,第10期,第135-167页(2009年)·Zbl 1284.62372号
[16] 加西亚·埃斯库德罗,洛杉矶。;Gordaliza,A。;马特兰,C。;Mayo-Iscar,A.,稳健聚类分析的一般修正方法,《统计年鉴》,361324-1345(2008)·兹比尔1360.62328
[17] 加西亚·埃斯库德罗,洛杉矶。;Gordaliza,A。;马特兰,C。;Mayo-Iscar,A.,稳健聚类方法综述,数据分析和分类进展,4,89-109(2010)·Zbl 1284.62375号
[18] 加西亚·埃斯库德罗,洛杉矶。;Gordaliza,A。;马特兰,C。;Mayo-Iscar,A.,《探索基于稳健模型的聚类中的组数》,《统计与计算》,第21585-599页(2011年)·Zbl 1221.62093号
[19] 加特,I。;Geva,A.B.,无监督最优模糊聚类,IEEE模式分析和机器智能汇刊,11,773-781(1989)·Zbl 0709.62592号
[21] Hathaway,R.J.,正态混合分布最大似然估计的约束公式,《统计年鉴》,13795-800(1985)·Zbl 0576.62039号
[22] 哈撒韦·R·J。;Bezdek,J.C.,切换回归模型和模糊聚类,IEEE模糊系统汇刊,1195-204(1993)
[23] Kim,J。;Krishnapuram,R。;Davé,R.,最小平方法在基于原型聚类中的应用,模式识别快报,17,633-641(1996)
[24] Klawonn,F.,噪声固定分数的噪声聚类。带固定噪声分数的噪声聚类,在软计算中的应用和科学(2004),Springer:Springer-Belin-Heidelberg-New York,pp.133-138
[25] Krishnapuram,R。;Keller,J.M.,聚类的可能性方法,IEEE模糊系统汇刊,198-110(1993)
[26] Krishnapuram,R。;Keller,J.M.,《可能性C均值算法:见解和建议》,IEEE模糊系统汇刊,4385-393(1996)
[27] Łeski,J.,走向稳健的模糊聚类,模糊集与系统,137,215-233(2003)·Zbl 1043.62058号
[28] 麦克拉克伦,G。;Peel,D.,有限混合模型(2000),John Wiley Sons,Ltd.:John Willey Sons,有限公司,纽约·Zbl 0963.62061号
[29] 宫本茂,S。;Mukaidono,M.,作为正则化和最大熵方法的模糊c均值,第七届国际模糊系统协会世界大会(IFSA’97),286-92(1997)
[30] Neykov,N。;Filzmoser,P。;迪莫娃,R。;Neytchev,P.,使用修剪似然估计对混合物进行稳健拟合,计算统计与数据分析,52,299-308(2007)·Zbl 1328.62033号
[31] 雷姆·F。;Klawonn,F。;Kruse,R.,《一种新的噪声聚类异常值检测方法》,《软计算》,第11489-494页(2007年)
[32] Rousseeuw,P.J。;特劳瓦特,E。;Kaufman,L.,高对比度模糊聚类,计算与应用数学杂志,64,81-90(1995)·Zbl 0847.62052号
[33] Rousseeuw,P.J。;考夫曼,L。;Trauwaert,E.,使用分散矩阵的模糊聚类,计算统计和数据分析,23135-151(1996)·兹比尔0900.62321
[34] Rousseeuw,P.J。;Van Driessen,K.,最小协方差行列式估计的快速算法,技术计量学,41,212-223(1999)
[35] Ruspini,E.,《集群的新方法,信息和控制》,第15、22-32页(1969年)·Zbl 0192.57101号
[36] 特劳瓦特,E。;考夫曼,L。;Rousseeuw,P.J.,基于最大似然原理的模糊聚类算法,模糊集与系统,42,213-227(1991)·Zbl 0741.62065号
[37] Wu,K.-L。;Yang,M.-S.,Alternative(c)-means聚类算法,模式识别,352267-2278(2002)·兹比尔1006.68876
[38] Yang,M.-S.,关于一类模糊分类最大似然过程,模糊集与系统,57337-365(1993)·Zbl 0807.62049号
[39] 杨,硕士。;Wu,K.-L.,无监督可能性聚类,模式识别,39,5-21(2006)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。