×

不确定目标的多视点谱聚类。 (英语) Zbl 1479.62042号

摘要:在机器学习和模式识别领域,不确定性数据聚类是一项重要的工作,因为数据中的不确定性使得聚类过程更加困难。最近,多视图聚类越来越受到某些数据的数据挖掘者的关注,因为与基于单个视点的分组相比,它能产生良好的结果。在不确定数据聚类中,相似性度量起着至关重要的作用。然而,最先进的相似性度量受到一些限制。例如,当两个不确定数据的两个分布在位置上严重重叠时,仅使用几何相似性度量是不够的。另一方面,当两个不确定数据不接近或完全分离时,基于概率分布的相似性度量是不够的。在本研究中,通过对数据集每个视图的重叠程度融合诱导核距离和Jeffrey散度,构造自适应混合相似性度量(SAM)。SAM进一步与两两联合正则化在多视图谱聚类中用于分组不确定数据。本文还证明了所提出聚类算法的目标函数的收敛性。所有实验都是在九个真实世界的确定性数据集、三个真实世界的不确定性数据集和一个合成的不确定性数据集上进行的。在执行所有聚类算法之前,将九个真实世界的确定数据集进一步转换为不确定数据集。实验结果表明,该算法优于九种最新方法。使用五个聚类评估指标进行比较。该方法还通过零假设显著性检验进行了测试。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62M15型 随机过程和谱分析的推断
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 江,B。;裴,J。;Tao,Y。;Lin,X.,基于概率分布相似性的不确定数据聚类,IEEE知识与数据工程汇刊,25751-763(2013)
[2] 刘,H。;张,X。;Zhang,X.,用于聚类和分类不确定数据的基于世界的一致性学习模型,神经网络,102,48-66(2018)·Zbl 1434.68424号
[3] Sharma,K.K。;Seal,A.,《使用蒙特卡罗集成方法对不确定数据进行聚类建模》,《应用专家系统》,137100-116(2019)
[4] 马,Z。;Yan,L.,《模糊概念数据建模的文献综述》,《信息科学与工程杂志》,26,427-441(2010)
[5] S.K.Lee,《数据库中的不精确和不确定信息:证据方法》,载于:《数据工程》,1992年。诉讼程序。第八届国际会议,IEEE,第614-621页。
[6] A.P.Dempster,多值映射诱导的上下概率,收录于:Dempster-Shafer信念函数理论经典著作,Springer,2008年,第57-72页。
[7] Sarma,A.D。;O.Benjelloun。;Halevy,A。;Nabar,S。;Widom,J.,《表示不确定数据:模型、属性和算法》,《VLDB期刊——超大数据库国际期刊》,18989-1019(2009)
[8] 詹,K。;聂,F。;Wang,J。;Yang,Y.,多视图一致图聚类,IEEE图像处理汇刊,281261-1270(2018)
[9] A.Kumar,H.Daumé,《多视角谱聚类的联合训练方法》,载于《第28届机器学习国际会议论文集》(ICML-11),第393-400页。
[10] A.Kumar,P.Rai,H.Daume,协同规则化多视角光谱聚类,收录于《神经信息处理系统的进展》,第1413-1421页。
[11] 李毅,聂凤,黄宏,黄杰,基于二部图的大尺度多视角谱聚类,载:第二十届AAAI人工智能会议。
[12] Houthuys,L。;朗根,R。;Suykens,J.A.,多视图核谱聚类,信息融合,44,46-56(2018)
[13] Kanaan-Izquierdo,S。;齐亚季诺夫,A。;Perera-Lluna,A.,《使用公共特征向量的多视图和多特征光谱聚类》,《模式识别快报》,102,30-36(2018)
[14] 詹,K。;张,C。;关,J。;Wang,J.,多视图聚类的图形学习,IEEE控制论汇刊,482887-2895(2017)
[15] A.Blum,T.Mitchell,《将标记和未标记数据与联合训练相结合》,载于《第十一届计算学习理论年会论文集》,第92-100页。
[16] M.Saha,基于图的多视图聚类方法,收录于:模式识别和机器智能国际会议,Springer,第128-133页。
[17] 卢,C。;Yan,S。;Lin,Z.,凸稀疏谱聚类:从单视图到多视图,IEEE图像处理汇刊,252833-2843(2016)·Zbl 1408.94438号
[18] H.Gao,F.Nie,X.Li,H.Huang,多视点子空间聚类,收录于《IEEE计算机视觉国际会议论文集》,第4238-4246页。
[19] C.Zhang,Q.Hu,H.Fu,P.Zhu,X.Cao,潜在多视点子空间聚类,收录于:IEEE计算机视觉和模式识别会议论文集,第4279-4287页。
[20] J.Liu,C.Wang,J.Gao,J.Han,通过联合非负矩阵分解进行多视图聚类,摘自:2013年SIAM国际数据挖掘会议论文集,SIAM,第252-260页。
[21] G.Chao,S.Sun,J.Bi,《多视角聚类调查》,arXiv预印本arXiv:1712.06246(2017)。
[22] 李毅。;陈,J。;Feng,L.,《处理不确定性:理论与实践调查》,IEEE知识与数据工程汇刊,252463-2482(2012)
[23] Fuhr,N.,《数据库中模糊查询和不精确信息的概率框架》,载《第16届超大数据库国际会议论文集》,摩根,696-707(1990)
[24] 阿加瓦尔,C.C。;Philip,S.Y.,《不确定数据算法和应用的调查》,IEEE知识与数据工程汇刊,21609-623(2009)
[25] Pakyuz-Charrier,E。;Lindsay,M。;奥加戈,V。;Giraud,J。;Jessell,M.,隐式三维地质建模中结构数据不确定性估计的蒙特卡罗模拟,扰动分布选择和参数化指南,固体地球,9385-402(2018)
[26] M.Chau,R.Cheng,B.Kao,J.Ng,《不确定数据挖掘:位置数据聚类示例》,载于:太平洋亚洲知识发现和数据挖掘会议,Springer,第199-204页。
[27] S.D.Lee,B.Kao,R.Cheng,将uk-means简化为k-means,收录于:IEEE第七届数据挖掘研讨会国际会议(ICDMW 2007),IEEE,第483-488页。
[28] F.Gullo,G.Ponti,A.Tagarelli,通过k-medoids聚类不确定数据,收录于:可扩展不确定性管理国际会议,Springer,第229-242页·Zbl 07260356号
[29] H.-P.Kriegel,M.Pfeifle,《基于密度的不确定数据聚类》,载于《第十一届ACM SIGKDD数据挖掘知识发现国际会议论文集》,第672-677页。
[30] H.-P.Kriegel,M.Pfeifle,《基于密度的不确定数据分层聚类》,载于:第五届IEEE国际数据挖掘会议(ICDM’05),IEEE,第689-692页。
[31] 廖锦涛,刘春明,使用质心边界进行不确定数据挖掘的有效聚类机制,收录于:2016年国际计算机研讨会(ICS),IEEE,第300-305页。
[32] G.Cormode,A.McGregor,《聚类不确定数据的近似算法》,载于《第二十七届ACM SIGMOD-SIGACT-SIGART数据库系统原理研讨会论文集》,ACM,第191-200页。
[33] F.Gullo,A.Tagarelli,基于不确定质心的不确定数据分区聚类,arXiv预印本arXiv:1203.6401(2012)。
[34] Gullo,F。;Ponti,G。;Tagarelli,A.,最小化聚类不确定对象的聚类混合模型方差,统计分析和数据挖掘:ASA数据科学期刊,6,116-135(2013)·Zbl 07260356号
[35] R.Rao Kurada,《使用计算几何和索引技术对空间数据库中的不确定数据对象进行无监督分类》,arXiv预印本arXiv:1312.2378(2013)。
[36] A.Erdem,T.I。GüNDEM,M-fdbscan:基于多核密度的不确定数据聚类算法,土耳其电气工程与计算机科学杂志22(2014)143-154。
[37] H.Hamdan,G.Govaert,不确定数据的混合模型聚类,载于:第14届IEEE模糊系统国际会议,2005年。FUZZ'05,IEEE,第879-884页。
[38] P.B.Volk,F.Rosenthal,M.Hahmann,D.Habich,W.Lehner,用可能世界聚类不确定数据,收录于:2009年IEEE第25届国际数据工程会议,IEEE,第1625-1632页。
[39] A.Züfle,T.Emrich,K.A.Schmid,N.Mamoulis,A.Zimek,M.Renz,《不确定数据的代表性聚类》,载于《第20届ACM SIGKDD国际知识发现和数据挖掘会议论文集》,第243-252页。
[40] Von Luxburg,U.,《光谱聚类、统计和计算教程》,17,395-416(2007)
[41] Jiao,L。;尚,F。;王,F。;Liu,Y.,带增强谱嵌入的快速半监督聚类,模式识别,45,4358-4369(2012)·Zbl 1248.68407号
[42] Kim,T.H。;Lee,K.M。;Lee,S.U.,学习频谱分割的完全两两亲和力,IEEE模式分析和机器智能汇刊,351690-1703(2013)
[43] 布隆德,B。;拉曼纳,C。;维奥勒,C。;Enquist,B.J.,《n维超体积》,《全球生态与生物地理学》,第23期,第595-609页(2014年)
[44] 史J。;Malik,J.,归一化剪切和图像分割,部门论文(CIS),107(2000)
[45] S.Z.Selim,M.A.Ismail,《K-means型算法:广义收敛定理和局部最优性的表征》,IEEE模式分析和机器智能汇刊,1984年,81-87·Zbl 0546.62037号
[46] 博伊德,S。;博伊德,S.P。;Vandenberghe,L.,《凸优化》(2004),剑桥大学出版社·Zbl 1058.90049号
[47] N.W.S.N.U.D.o.C.气候预测中心,国家环境预测中心,Cpc全球日/月观测总结,1987年。
[48] 科特克,M。;Grieser,J。;贝克,C。;鲁道夫,B。;Rubel,F.,更新的科宾-盖革气候分类世界地图,《气象》,第15期,第259-263页(2006年)
[49] 罗德里格斯,J。;Medina-Pérez,文学硕士。;古铁雷斯-罗德里格斯,A.E。;蒙罗伊,R。;Terashima-Marín,H.,使用监督分类器集成进行集群验证,基于知识的系统,134-144(2018)
[50] 密封,A。;Karlekar,A。;O.Krejcar。;Gonzalo-Martin,C.,使用基于jeffreys-dievergence的相似性度量的模糊C-means聚类,应用软件计算,88,第106016条,pp.(2020)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。