×

基于可靠性的模糊聚类集成。 (英语) Zbl 1467.62112号

摘要:在聚类集成中,基聚类的质量会影响一致性聚类。尽管一些研究致力于对基聚类进行加权,但模糊聚类级别的加权被忽略了,更具体地说,他们没有注意到聚类可靠性在模糊聚类集成中的作用。本文提出了一种新的基于模糊聚类层次加权的模糊聚类集成框架,该框架不考虑数据对象的特征。每个模糊聚类的可靠性是基于对其不可靠性的估计来计算的,并被视为其在集合中的权重。基于熵准则,利用集合中模糊聚类之间的相似性来估计模糊聚类的不可靠性。在我们的框架中,最终聚类由两类一致性函数产生:(1)根据基聚类构造基于可靠性的加权模糊联合矩阵,然后,在矩阵上应用单一的传统聚类,如层次凝聚聚类或K-means,以产生最终聚类。(2)一种新的基于图的模糊一致性函数。基于图的一致性函数在数据对象数量上具有线性时间复杂性。在各种标准数据集上的实验结果表明,与最新方法相比,该方法在评估标准和聚类稳健性方面是有效的。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62小时86 多元分析与模糊性
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Kleinberg,J.M.,《聚类的不可能性定理》(Adv.Neural Inf.Process,Syst.(2003)),463-470
[2] 斯特雷尔,A。;Ghosh,J.,《集群集成——用于组合多个分区的知识重用框架》,J.Mach。学习。决议,3583-617(2002)·Zbl 1084.68759号
[3] 弗恩,X.Z。;Brodley,C.E.,通过二部图划分解决集群集成问题,(Proc.Twenty-First Int.Conf.Mach.Learn.(2004)),36
[4] Kuncheva,L.I.,《组合模式分类器:方法和算法》(2004),John Wiley&Sons·Zbl 1066.68114号
[5] Fred,A.,《集群集成方法:从单个集群到组合解决方案》,(计算智能研究,第30卷(2008)),3-30
[6] Vega-Pons,S。;Ruiz Shulcloper,J.,聚类集成算法调查,Int.J.模式识别。Artif公司。智力。,25337-372(2011年)
[7] 刘,H。;吴杰。;刘,T。;陶,D。;Fu,Y.,通过加权k均值的谱系综聚类:理论和实践证据,IEEE Trans。知识。数据工程,29,1129-1143(2017)
[8] A.Topchy,A.K.Jain,W.Punch,结合多个弱聚类,in:第三IEEE Int.Conf.Data Min.,IEEE Comput。Soc,第331-338页https://doi.org/10.109/ICDM.2003.1250937。
[9] Gullo,F。;塔加雷利,A。;Greco,S.,《用于集群的基于分集的加权方案》,(Proc.2009 SIAM Int.Conf.Data Min.(2009)),437-448
[10] 黄,D。;赖,J.-H。;Wang,C.-D.,通过人群一致性估计和多粒度链接分析结合多个聚类,神经计算,170,240-250(2015)
[11] 李·T。;Ding,C.,加权共识聚类(Proc.2008 SIAM Int.Conf.Data Min.(2008)),798-809
[12] 于,Z。;李,L。;高,Y。;你,J。;刘杰。;Wong,H.S。;Han,G.,混合聚类解决方案选择策略,模式识别。,47, 3362-3375 (2014)
[13] Berikov,V.B.,模糊聚类集成的概率模型,模式识别。图像分析。,28, 1-10 (2018)
[14] 钟,C。;岳,X。;张,Z。;Lei,J.,聚类集成:基于路径变换的两级细化联合关联矩阵,模式识别。,48, 2699-2709 (2015) ·Zbl 1395.62179号
[15] 普内拉,K。;Ghosh,J.,基于共识的软聚类集成,应用。Artif公司。智力。,22, 780-810 (2008)
[16] Dhillon,I.S.,一种用于文本分类的分割信息理论特征聚类算法,J.Mach。学习。第3号决议,1265-1287(2003)·Zbl 1102.68545号
[17] Kullback,S。;Leibler,R.A.,《信息与充分性》,《数学年鉴》。《统计》,22,79-86(1951)·Zbl 0042.38403号
[18] Dimitriadou,E。;Weingessel,A。;Hornik,K.,《模糊聚类的组合方案》,国际期刊《模式识别》。Artif公司。智力。,16, 901-912 (2002)
[19] 阿伏加德里,R。;Valentini,G.,基于DNA微阵列数据分析随机投影的模糊集合聚类,Artif。智力。医学,45,173-183(2009)
[20] 拉托尔,P。;Bezdek,J.C。;埃尔法尼,S.M。;拉贾塞加拉,S。;Palaniswami,M.,在随机投影上使用累积聚合的集合模糊聚类,IEEE Trans。模糊系统。,26, 1510-1524 (2018)
[21] 萨哈,I。;Maulik,美国。;Bandyopadhyay,S。;Plewczynski,D.,SVMeFC:用于卫星图像分割的SVM集成模糊聚类,IEEE Geosci。遥感快报。,9, 52-55 (2012)
[22] Maulik,美国。;Saha,I.,用于遥感图像像素分类的改进差分进化模糊聚类,模式识别。,42, 2135-2149 (2009) ·Zbl 1192.68592号
[23] 萨哈,S。;Bandyopadhyay,S.,新的基于对称性的聚类有效性指数在卫星图像分割中的应用,IEEE Geosci。遥感快报。,5, 166-170 (2008)
[24] 达斯,S。;Konar,A.,《改进差分进化的自动图像像素聚类》,应用。软计算。,9, 226-236 (2009)
[25] Bezdek,J.C。;埃利希·R。;Full,W.,FCM:模糊c-均值聚类算法,计算。地质科学。,10, 191-203 (1984)
[26] Kailath,T.,《信号选择中的散度和巴塔查里亚距离测量》,IEEE Trans。Commun公司。技术。,15, 52-60 (1967)
[27] Alizadeh,H。;Minaei-Bidgoli,B。;Parvin,H.,在字符串表示中优化模糊聚类集成,国际J。模式识别。Artif公司。智力。,27,第1350005条pp.(2013)
[28] 塞维拉诺,X。;阿利亚斯,F。;Socoró,J.C.,模糊聚类集合的基于位置和置信度投票的一致性函数,模糊集系统。,193, 1-32 (2012)
[29] Kuhn,H.W.,分配问题的匈牙利方法,Nav。Res.Logist.公司。,2, 83-97 (1955) ·Zbl 0143.41905号
[30] Van Erp,M。;Vuurpijl,L。;Schomaker,L.,《模式识别投票方法的概述与比较》(Front.Handwrit.recognition,2002)。诉讼程序。第八国际工作(2002),195-200
[31] Copeland,A.H.,《合理的社会福利函数》(Mimeogr.摘自《密歇根大学社会科学应用数学》(1951))
[32] J.C.de Borda,《历史上的莫尔表面选择》。l'Academie R.Des科学。波尔,1781年(巴黎,1784年)。(1784).
[33] Bedalli,E。;Mançellari,E。;Asilkan,O.,提高模糊聚类分析稳定性的异质聚类集成模型,Proc。计算。科学。,102, 129-136 (2016)
[34] de Oliveira,J.V。;萨博,A。;de Castro,L.N.,《聚类集合中的粒子群聚类:利用剪枝和无对齐共识》,应用。软计算。,55, 141-153 (2017)
[35] 球,G。;Hall Dj,I.,一种新的数据分析和模式分类方法。Isodata,一种新的数据分析和模式分类方法(1965),Tch。报告5RI,项目5533
[36] Caliánski,T。;Harabasz,J.,用于聚类分析的树枝晶方法,Commun。统计方法,3,1-27(1974)·Zbl 0273.62010
[37] Dunn,J.C.,《Well-sparated clusters and optimal fuzzy partitions》,J.Cybern。,4, 95-104 (1974) ·Zbl 0304.68093号
[38] Rousseeuw,P.J.,《Silhouettes:聚类分析解释和验证的图形辅助》,J.Comput。申请。数学。,20, 53-65 (1987) ·Zbl 0636.62059号
[39] 北卡罗来纳州帕尔。;Bezdek,J.C.,《关于模糊C-均值模型的聚类有效性》,IEEE Trans。模糊系统。,3, 370-379 (1995)
[40] De Castro,L.N.,《自然计算基础:基本概念、算法和应用》(2006),查普曼和霍尔/CRC·Zbl 1130.68059号
[41] 安德森,D.T。;Bezdek,J.C。;波佩斯库,M。;Keller,J.M.,《比较模糊、概率和可能性划分》,IEEE Trans。模糊系统。,18, 906-918 (2010)
[42] 乔杜里,B.B。;Bhattacharya,A.,关于两个模糊集之间的相关性,模糊集系统。,118, 447-456 (2001) ·Zbl 1013.62067号
[43] Raha,S。;侯赛因,A。;Ghosh,S.,《基于相似性的近似推理:模糊控制》,J.Appl。日志。,6, 47-71 (2008) ·Zbl 1148.68046号
[44] Stewart,W.J.,《概率、马尔可夫链、队列和模拟:性能建模的数学基础》(2009),普林斯顿大学出版社·Zbl 1176.60003号
[45] Shannon,C.E.,《通信数学理论》,贝尔系统。《技术期刊》,27,379-423(1948)·Zbl 1154.94303号
[46] 盖,T.M。;Thomas,J.A.,《信息理论的要素》(2012),John Wiley&Sons
[47] Fred,a.法律公告。;Jain,a.K.,使用证据积累进行数据聚类,对象识别。支持。通过用户交互,服务。机器人。,4, 276-280 (2002)
[48] 卡利皮斯,G。;Kumar,V.,《划分不规则图的快速高质量多级方案》,SIAM J.Sci。计算。,20, 359-392 (1998) ·Zbl 0915.68129号
[49] C.L.Blake,C.J.Merz,UCI机器学习数据库库。加利福尼亚州欧文:加利福尼亚大学计算机系。科学。55 (1998) 网址:http://www.ics.uci.edu/mlearn/MLRepository.html。
[50] 埃尔南德斯,A.F。;Uengo,J.L。;Errac KEEL,J.D.,《数据挖掘软件工具:数据集存储库、算法集成和实验分析框架》,J.Mult-有价值的日志。柔软。计算。,17, 255-287 (2011)
[51] 南卡罗来纳州奥德万。;斯托克韦尔,E.B。;彭宁顿,R.L。;汉弗莱斯,R.M。;Zumach,W.A.,《利用神经网络实现恒星/星系的自动识别》,Astron。J.,103,318-331(1992)
[52] Silva Filho,T.M。;Pimentel,B.A。;苏扎,R.M.C.R。;Oliveira,A.L.I.,基于模糊c-均值和改进粒子群优化的模糊聚类混合方法,专家系统。申请。,42, 6315-6328 (2015)
[53] Davies,D.L。;Bouldin,D.W.,《集群分离措施》,IEEE Trans。模式分析。机器。智力。,224-227 (1979)
[54] 吴杰。;刘,H。;熊,H。;曹,J。;Chen,J.,K-means-based consensus clustering:a unified view,IEEE Trans。知识。数据工程,27,155-169(2015)
[55] Friedman,M.,《使用秩来避免方差分析中隐含的正态假设》,《美国统计协会期刊》,32,675-701(1937)·JFM 63.1098.02号
[56] Gower,J.C.,《相似性、差异性和距离的度量》(Read,Johnson C.B.,Encycl.Stat.Sci.,第5卷(1985)),397-405
[57] 考克斯,T.F。;Cox,M.A.A.,多维标度(2000),查普曼和霍尔/CRC·Zbl 0853.62047号
[58] Mardia,K.V。;Kent,J.T。;Bibby,J.M.,多元分析(1979),Probab。数学。美国国家科学院。Press Inc.(未注明日期)·Zbl 0432.62029号
[59] Stapelberg,R.F.,工程设计中的可靠性和性能,(Handb.Reliab.Availability,Maintainab.Saf.Eng.Des.(2009)),43-294·Zbl 1170.90001号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。