×

基于核的方法识别具有线性和非线性边界的重叠簇。 (英语) 兹比尔1335.62091

摘要:检测重叠结构和识别形状复杂的非线性不可分割簇是聚类中的两个主要问题。本文提出了两种基于核的方法来生成具有线性和非线性边界的重叠簇。为了提高输入模式的可分性,我们在这两种方法中都使用了Mercer核技术。首先,我们提出了基于质心的核重叠-均值I(KOKMI)方法,推广了核-均值来产生具有非线性分离的非分离簇。其次,我们提出了核重叠(K\)均值II(KOKMII),这是一种基于medoid的方法,在效率和复杂性方面改进了以前的方法。在非线性可分和真实多标记数据集上进行的实验表明,所提出的学习方法优于现有的方法。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] ALIGULIYEV,R.M.(2009),“文档收集的聚类-加权方法”,《应用专家系统》,第36期,第7904-7916页。
[2] BANERJEE,A.、KRUMPELMAN,C.、BASU,S.、MOONEY,R.J.和GHOSH,J.(2005),“基于模型的重叠聚类”,摘自美国芝加哥知识发现和数据挖掘国际会议,第532-537页。
[3] BARLA,A.、ODONE,F.和VERRI,A.(2003),“图像分类的直方图交叉核”,2003年国际图像处理会议(ICIP),第513-516页。
[4] BEN-HUR,A.、HORN,D.、SIEGELMANN,H.T.和VAPNIK,V.(2001),“支持向量聚类”,《机器学习研究杂志》,第2125-137页·Zbl 1002.68598号
[5] CAMASTRA,F.和VERRI,A.(2005),“一种新的聚类核心方法”,IEEE模式分析和机器智能汇刊,27801-804。
[6] CEULEMANS,E.和KIERS,H.A.(2006),“在不同类型和复杂度的三模主成分模型中进行选择:基于数值凸壳的方法”,英国数学和统计心理学杂志,59,133-150。
[7] CHAO-LIU,Y.、WU,C.和LIU,M.(2011),“文本信息快速SOM聚类研究”,应用专家系统,38,9325-9333。
[8] CLEUZIOU,G.(2008),“用于重叠聚类的<Emphasis Type=“Italic”>K-means方法的扩展版本”,国际模式识别会议(ICPR),美国佛罗里达州:IEEE,第1-4页。
[9] CLEUZIOU,G.(2010),“重叠聚类的OKM的两种变体”,《知识发现和管理的进展》,编辑F.Guillet等人,海德堡:Springer,第149-166页·Zbl 1202.68337号
[10] CLEUZIOU,G.(2013),“Osom:构建重叠拓扑图的方法”,模式识别信函,34,239-246。
[11] CORTES,C.和VAPNIK,V.(1995),“支持向量网络”,《机器学习》,第20期,第273-297页·Zbl 0831.68098号
[12] CRISTIANINI,N.、CAMPBELL,C.和BURGES,C.(2002),“编辑:核心方法:当前研究和未来方向”,机器学习,46,5-9。
[13] DEODHAR,M.和GHOSH,J.(2006),“检测微阵列数据中重叠簇的共识聚类”,美国加利福尼亚州洛斯阿拉米托斯国际数据挖掘会议:IEEE计算机学会,第104-108页。
[14] DEPRIL,D.、VAN MECHELEN,I.和WILDERJANS,T.F.(2012),“低维加性重叠聚类”,《分类杂志》,29,297-320·Zbl 1360.62326号
[15] DEPRIL,D.、VAN MECHELEN,I.和MIRKIN,B.(2008),“矩形数据表的加性聚类算法”,计算统计与数据分析,52,4923-4938·兹比尔1452.62439
[16] DESARBO,W.和CRON,W.(1988),“聚类线性回归的最大似然方法”,《分类杂志》,第5期,第249-282页·Zbl 0692.62052号
[17] FELLOWS,M.R.、GUO,J.、KOMUSIEWICZ,C.、NIEDERMEIER,R.和UHLMANN,J.(2011),“基于图的重叠数据聚类”,离散优化,8,2-17·Zbl 1248.90070号
[18] FILIPONE,M.、CAMASTRA,F.、MASULLI,F.和ROVETTA,S.(2008),“聚类的核和谱方法综述”,模式识别,41776-190·Zbl 1122.68530号
[19] GIROLAMI,M.(2002),“特征空间中基于Mercer内核的聚类”,《IEEE神经网络汇刊》,第13期,第780-784页。
[20] GRAEPEL,T.和OBERMAYER,K.(1998年),“模糊地形核聚类”,《第五次胃肠病研讨会模糊神经系统会议记录》,第90-97页。
[21] INOKUCHI,R.和MIYAMOTO,S.(2004),“使用核函数的LVQ聚类和SOM”,《IEEE模糊系统国际会议论文集》,第1497-1500页。
[22] LINGRAS,P.和WEST,C.(2004),“使用粗糙K-Means对Web用户进行区间集聚类”,《智能信息系统杂志》,23,5-16·Zbl 1074.68586号
[23] LODHI,H.、CRISTIANINI,N.、SHAWE-TAYLOR,J.和WATKINS,C.(2001),“使用字符串内核进行文本分类”,《机器学习研究杂志》,2419-444·Zbl 1013.68176号
[24] LU,H.、HONG,Y.、STREET,W.、WANG,F.和TONG,H.(2012),“稀疏约束下的重叠聚类”,IEEE第十二届国际数据挖掘研讨会(ICDMW),第486-494页。
[25] MASSON,M.-H.和DENUX,T.(2008),“ECM:模糊c均值算法的证据版本”,模式识别,411384-1397·Zbl 1131.68081号
[26] MIRKIN,B.G.(1987年a),“相似度矩阵的加性聚类和定性因子分析方法”,《分类杂志》,第4期,第7-31页·Zbl 0617.62064号
[27] MIRKIN,B.G.(1987b),“主聚类分析方法”,《自动化和远程控制》,第48期,第1379-1386页·Zbl 0643.62047号
[28] MIRKIN,B.G.(1990),“线性数据分析模型的顺序拟合程序”,《分类杂志》,第7期,第167-195页·Zbl 0727.62065号
[29] PéEREZ-SUáREZ,A.、MARTĺNEZ-TRINIDAD,J.F.、CARRASCO-OCHOA,J.A.和MEDINA-PAGOLA,J.E.(2013),“OClustR:一种新的基于图形的重叠聚类算法”,神经计算,109,1-14。
[30] QINAND,A.K.和SUGANTAN,P.N.(2004),“核神经气体算法在聚类分析中的应用”,模式识别国际会议,4617-620。
[31] SCHLKOPF,B.、SMOLA,A.和MüLLER,K.-R(1998),“作为核心特征值问题的非线性成分分析”,神经计算,101299-1319。
[32] SNOEK,C.G.M.,WORRING,M.,VAN GEMERT,J.C.,GEUSEBROEK,J.-M.和SMEULDERS,A.W.M.(2006),“多媒体中101个语义概念的自动检测的挑战问题”,载于美国纽约第14届ACM多媒体国际年会论文集:ACM,Multimedia’06,第421-430页。
[33] TANG,L.和LIU,H.(2009),“基于稀疏社会维度的集体行为可扩展学习”,载于第18届ACM信息与知识管理会议论文集,第1107-1116页。
[34] TROHIDIS,K.,TSOUMAKAS,G.,KALLIRIS,G.和VLAHAVAS,I.P.(2008),“音乐到情感的多标签分类”,国际音乐信息检索会议(ISMIR),第325-330页。
[35] VAN HATUM,P.和HOIJTINK,H.(2009),“使用品牌战略研究的市场细分:对数线性模型混合的贝叶斯推断”,分类杂志,26297-328·Zbl 1337.62144号
[36] WANG,Q.和FLEURY,E.(2011),《揭示重叠的社区结构》,摘自《复杂网络》,《计算机与信息科学通信》第116卷,第176-186页。
[37] WANG,X.、TANG,L.、GAO,H.和LIU,H.(2010),“发现社交媒体中的重叠组”,摘自2010年IEEE数据挖掘国际会议论文集,第569-578页。
[38] WIECZORKOWSKA,A.、SYNAK,P.和RAS,Z.(2006年),“音乐中情感的多标签分类”,《智能信息处理和Web挖掘》,《软计算进展》第35卷,第307-315页。
[39] WILDERJANS,T.、CEULEMANS,E.、VAN MECHELEN,I.和DEPRIL,D.(2011),“ADPROCLUS:通过可变数据矩阵将可加性轮廓聚类模型拟合到对象的图形用户界面”,行为研究方法,43,56-65。
[40] WILDERJANS,T.F.、DEPRIL,D.和VAN MECHELEN,I.(2012),“加性双聚类:一种新的和两种现有的ALS算法的比较”,《分类杂志》,30,56-74·Zbl 1360.62364号
[41] WILDERJANS,T.F.、CEULEMANS,E.和MEERS,K.(2013年),“CHull:基于一般凸壳的模型选择方法”,行为研究方法,45,1-15。
[42] WU,Z.、XIE,W.和YU,J.(2003),“基于核方法的模糊C均值聚类算法”,《第五届计算智能与多媒体应用国际会议论文集》,美国华盛顿特区:IEEE计算机学会。
[43] ZHANG,D.和CHEN,S.(2002),“使用核方法的模糊聚类”,国际控制与自动化会议,中国厦门,第123-127页。
[44] ZHANG,D.和CHEN,S.(2003),“基于核的模糊和可能性C均值聚类”,人工神经网络国际会议(ICANN),土耳其伊斯坦布尔,第122-125页。
[45] ZHANG,D.和CHEN,S.(2004),“一种新型核化模糊C均值算法及其在医学图像分割中的应用”,《医学人工智能》,32,37-50。
[46] ZHANG,S.,WANG,R.-S.,and ZHANG,X.-S.(2007),“使用模糊C均值聚类识别复杂网络中重叠的社区结构”,《物理学A:统计力学及其应用》,374483-490。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。