×

基于方差的三向聚类方法,用于处理重叠聚类。 (英语) Zbl 1434.68566号

摘要:传统的聚类方法在处理具有重叠区域的聚类时不是很有效。在这方面,三向聚类(3WC)是一种有效且有前景的方法。3WC中的一个关键问题是阈值的确定,它对准确估计重叠区域起着至关重要的作用。在本文中,我们提出了不同的基于方差的标准来确定阈值。特别是,我们检查了对象的3WC获得的三个区域中包含的对象的评估函数值的方差或扩散。引入了一种称为3WC-OR的算法,该算法通过结合遗传算法和博弈论粗糙集等方法,考虑了所提出的确定有效阈值的标准的优化。在五个UCI数据集上的实验结果表明,该算法显著改善了具有重叠簇的数据集的结果,并在具有非重叠簇的数据库上提供了可比较的结果。

MSC公司:

68层37 人工智能背景下的不确定性推理
62H30型 分类和区分;聚类分析(统计方面)
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Afridi,M.K。;北阿扎姆。;姚明,J.T。;Alanazi,E.,《使用GTRS处理缺失数据的三向聚类方法》,《国际期刊近似原因》。,98, 11-24 (2018) ·Zbl 1451.62070号
[2] Arabie,P。;卡罗尔,J.D。;德萨博,W。;Wind,J.,《重叠聚类:产品定位的新方法》,J.Mark.Res.,18,310-317(1981)
[3] Aslam,J.A。;Pelekhov,E。;Rus,D.,《静态和动态信息组织的星型聚类算法》,J.Graph Algorithms Appl。,8, 95-129 (2004) ·Zbl 1068.68098号
[4] 北阿扎姆。;Yao,J.T.,使用概率粗糙集的基于方差的三方决策确定,(国际粗糙集联合会议论文集。国际粗糙集联合会议论文集,IJCRS'16。粗糙集国际联合会议论文集。国际粗糙集联合会议论文集,IJCRS’16,计算机科学讲义,第9920卷(2016),209-218
[5] Bezdek,J.C.,《模糊目标函数算法的模式识别》(1981),Kluwer学术出版社:Kluwer-学术出版社,美国马萨诸塞州诺威尔·兹比尔0503.68069
[6] Bezdek,J.C。;埃利希·R。;Full,W.,FCM:模糊c-均值聚类算法,计算。地质科学。,10, 191-203 (1984)
[7] Campagner,A。;Ciucci,D.,《正交分区和软聚类:聚类验证的软互信息度量》,Knowl-基于系统。,180, 51-61 (2019)
[8] 查图尔维迪。;卡罗尔,J.D。;格林,体育。;Rotondo,J.A.,《通过重叠k-质心聚类进行市场细分的基于特征的方法》,J.Mark.Res.,34,370-377(1997)
[9] Cleuziou,G.,重叠聚类的k-means方法的扩展版本,(第19届模式识别国际会议(2008)),1-4
[10] 邓,X.F。;Yao,Y.Y.,《概率三方决策的多方面分析》,Fundam。通知。,132, 291-313 (2014) ·Zbl 1302.68257号
[11] Gabrielli,L。;朱弗里达,S。;Trovato,M.R.,《城市住房次级市场的差距和重叠:硬聚类和模糊聚类方法》,(评估:从理论到实践(2017)),203-219
[12] 高,C。;姚义勇,用齐方统计确定三方决策中的阈值,(粗糙集国际联合会议,国际粗糙集联合会议,IJCRS’16。国际粗糙集联合会议。国际粗糙集联合会议,IJCRS’16,计算机科学讲义,第9920卷(2016年),272-281
[13] 吉尔·加西亚,R.J。;巴迪亚·孔特列斯,J.M。;Pons-Porrata,A.,扩展恒星聚类算法,(伊比利亚美洲模式识别大会(2003)),480-487
[14] Goldberg,M。;凯利,S。;Ismail,M.M。;Mertsalov,K。;Wallace,A.,《在社交网络中发现重叠社区》(IEEE第二届社会计算国际会议(Socialcom)(2010)),104-113
[15] 赫伯特,J.P。;Yao,J.T.,博弈论粗糙集,Fundam。通知。,108, 267-286 (2011) ·Zbl 1243.91016号
[16] Holland,J.H.,《自然和人工系统的适应:生物学、控制和人工智能应用的介绍性分析》(1992年),麻省理工学院出版社
[17] 克里希纳普兰,R。;Joshi,A。;Yi,L.,k-medoids算法的模糊关系及其在web文档和片段聚类中的应用,(IEEE模糊系统国际会议(1999)),1281-1286
[18] Lichman,M.,UCI机器学习库(2013),(检索日期:2019-04-06)
[19] Lingras,P。;Peters,G.,粗糙聚类,Wiley跨学科评论:数据挖掘和知识发现,第1卷,64-72(2011)
[20] Lingras,P。;West,C.,使用粗糙k均值对网络用户进行区间集聚类,J.Intell。信息系统。,23, 5-16 (2004) ·Zbl 1074.68586号
[21] Long,A.N。;Dagogo-Jack,S.,糖尿病和高血压的共病:靶器官保护的机制和方法,临床杂志。高血压。,13, 244-251 (2011)
[22] MacQueen,J.,《多元观测分类和分析的一些方法》(第五届伯克利数理统计与概率研讨会(1967)),281-297·Zbl 0214.46201号
[23] 马吉德,B。;北阿扎姆。;Yao,J.T.,用遗传算法确定概率粗糙集的阈值,(粗糙集与知识技术国际会议。粗糙集与知能技术国际会议,RSKT’14。粗糙集与知识技术国际会议。粗糙集与知识技术国际会议,RSKT’14,计算机科学讲稿,第8818卷(2014),693-704
[24] Masson,M.H。;Denœux,T.,RECM:关系证据c均值算法,模式识别。莱特。,30, 1015-1026 (2009)
[25] 密特拉,S。;Banka,H。;Pedrycz,W.,粗糙模糊协同聚类,IEEE Trans。系统。人类网络。,B部分,网络。,36, 795-805 (2006)
[26] Ng,A.Y.先生。;M.I.乔丹。;Weiss,Y.,《关于谱聚类:分析和算法》,(神经信息处理系统进展(2002)),849-856
[27] Pedrycz,W.,《阴影集框架下的簇解释》,模式识别。莱特。,26, 2439-2449 (2005)
[28] 佩雷斯-苏亚雷斯,A。;马丁内斯·特立尼达,J.F。;Carrasco-Ochoa,J.A。;Medina-Pagola,J.E.,OClustR:一种新的基于图形的重叠聚类算法,神经计算,121,234-247(2013)
[29] Peters,G.,《利用无差异原则进行粗聚类》,《信息科学》。,277, 358-374 (2014)
[30] 彼得斯,G。;克雷斯波,F。;Lingras,P。;韦伯,R.,《软聚类——模糊和粗糙方法及其扩展和衍生》,《国际期刊近似推理》。,54, 307-322 (2013)
[31] Rousseeuw,P.J.,《Silhouettes:聚类分析解释和验证的图形辅助》,J.Comput。申请。数学。,20, 53-65 (1987) ·Zbl 0636.62059号
[32] Sun,P.G。;高,L。;Han,S.S.,复杂网络中重叠和非重叠群落结构的模糊聚类识别,信息科学。,181, 1060-1071 (2011) ·Zbl 1208.91120号
[33] 王,P.X。;Yao,Y.Y.,CE3:一种基于数学形态学的三元聚类方法,Knowl-基于系统。,155, 54-65 (2018)
[34] 黄,J.J。;Gleich,D.F。;Dhillon,I.S.,使用邻居膨胀种子扩展的重叠社区检测,IEEE Trans。知识。数据工程,28,1272-1284(2016)
[35] 姚明,J.T。;Azam,N.,基于Web的医疗决策支持系统,用于使用游戏理论粗糙集进行三方医疗决策,IEEE Trans。模糊系统。,23, 3-15 (2015)
[36] 姚明,J.T。;赫伯特,J.P.,《粗糙集分析的博弈理论视角》,J.重庆邮电大学。(自然科学编辑),20291-298(2008)
[37] 姚,Y。;Lingras,P。;王,R。;Miao,D.,区间集聚类分析:重构,(粗糙集、模糊集、数据挖掘和粒度软件计算国际研讨会(2009)),398-405
[38] Yao,Y.Y.,《三方决策理论概述》,(第八届国际粗糙集与计算当前趋势会议,第八届粗糙集与计算机当前趋势国际会议,RSCTC’12。第八届国际粗糙集会议和当前计算趋势。第八届国际粗糙集与当前计算趋势会议,RSCTC’12,计算机科学讲稿,第7413卷(2012)),1-17·兹比尔1404.68177
[39] Yao,Y.Y。;Gao,C.,《三方决策的统计解释》,(第十届国际粗糙集与知识技术会议,第十届粗糙集和知识技术国际会议,RSKT’15。第十届粗糙集与知识技术国际会议。第十届粗糙集与知识技术国际会议,RSKT’15,计算机科学讲义,第9436卷(2015)),309-320
[40] Yu,H.,三元聚类分析框架,(第二届国际粗糙集联合会议,第二届粗糙集国际联合会议,IJCRS’17。第二届国际粗糙集联合会议。第二届国际粗糙集联合会议,IJCRS’17,计算机科学讲义,第10313卷(2017),300-312
[41] Yu,H。;陈,Y。;Lingras,P。;Wang,G.,《大规模数据的三向聚类集成方法》,《国际期刊近似原因》。,115, 32-49 (2019) ·Zbl 1471.62401号
[42] Yu,H。;陈,Y。;姚,J。;Wang,X.,基于改进的DBSCAN算法Phys的三向聚类方法。A、 统计机械。申请。,535,第122289条pp.(2019)
[43] Yu,H。;焦,P。;Yao,Y.Y。;Wang,G.Y.,用三方决策检测和细化复杂网络中的重叠区域,信息科学。,373, 21-41 (2016) ·Zbl 1429.68245号
[44] Yu,H。;刘,Z。;Wang,G.,使用决策理论粗糙集自动确定簇数的方法,国际期刊近似推理。,5510-115(2014)·Zbl 1316.68121号
[45] Yu,H。;苏,T。;Zeng,X.H.,不完全数据的三向决策聚类算法,(第九届粗糙集与知识技术国际会议,第九届粗集与知识科技国际会议,RSKT’14。第九届粗糙集与知识技术国际会议。第九届粗糙集与知识技术国际会议,RSKT’14,计算机科学讲稿,第8818卷(2014),765-776·Zbl 1323.68451号
[46] O.扎米尔。;Etzioni,O.,《网络文档聚类:可行性论证》(《第21届国际ACM SIGIR信息检索研究与开发会议论文集》,1998年),46-54
[47] 张,M.L。;Zhou,Z.H.,ML-KNN:多标签学习的懒惰学习方法,模式识别。,40, 2038-2048 (2007) ·Zbl 1111.68629号
[48] 张,S。;Wang,R.S。;Zhang,X.S.,使用模糊c-均值聚类识别复杂网络中重叠的社区结构,物理学。A、 统计机械。申请。,374, 483-490 (2007)
[49] 周,J。;赖,Z。;Miao,D。;高,C。;Yue,X.,基于阴影集的多粒度粗模糊聚类,信息科学。,507553-573(2020)·Zbl 1456.62124号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。