×

GraphLSHC:走向大规模谱超图聚类。 (英语) Zbl 1475.68306号

摘要:Hypergraph被广泛用于统一描述对象之间的多关系,谱聚类被认为是将这些对象(顶点)划分为不同社区的最有效算法之一。然而,超图(HC)的传统谱聚类在时间和空间上都付出了昂贵的代价。本文提出了一个名为GraphLSHC的框架来解决大规模超图谱聚类所面临的可扩展性问题。在我们的解决方案中,GraphLSHC中使用的超图被扩展为一种通用格式,以捕获复杂的高阶关系。此外,GraphLSHC能够根据“特征技巧”同时划分顶点和超边,这为降低聚类的计算复杂度提供了一种方法。为了进一步提高性能,提出了几种基于超边的采样技术,它可以用整个图形信息来补充采样矩阵。我们还为补遗的误差边界提供了理论保证。几项实验表明,该框架优于最先进的算法。

MSC公司:

68T05型 人工智能中的学习和自适应系统
05C65号 Hypergraphs(Hypergraph)
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 王,S。;Siskind,J.M.,带比率切割的图像分割,PAMI,25,6,675-690(2003)
[2] 周,D。;黄,J。;Schölkopf,B.,《超图学习:聚类、分类和嵌入》,NIPS,1601-1608(2006)
[3] 史J。;Malik,J.,标准化切割和图像分割,PAMI,22,8,888-905(2000)
[4] M.Meila,J.Shi,光谱分割的随机漫步视图。aistats、Ai和统计学。
[5] Ng,A.Y。;约旦医学院。;Weiss,Y.,《关于谱聚类:分析和算法》,NIPS,849-856(2001)
[6] Purkait,P。;Chin,T。;萨德里,A。;Suter,D.,用超图聚类:大型超边的案例,PAMI,39,9,1697-1711(2017)
[7] J.Bu,S.Tan,C.Chen,C.Wang,H.Wu,L.Zhang,X.He,统一超图音乐推荐:结合社交媒体信息和音乐内容,收录于:MM,2010年,第391-400页。doi:10.1145/1873951.1874005。
[8] Scabini,L.F.S。;里巴斯,L.C。;Bruno,O.M.,用于颜色纹理分析的空间光谱网络,Inf.Sci。,515, 64-79 (2020)
[9] 刘,Q。;孙,Y。;王,C。;刘,T。;Tao,D.,图像聚类和半监督分类的弹性网超图学习,IEEE Trans。图像处理,26,1,452-463(2017)·Zbl 1409.94387号
[10] 郑,X。;罗,Y。;Sun,L。;丁,X。;张杰,基于超图拓扑结构的新型社交网络混合推荐系统,万维网,21,4,985-1013(2018)
[11] X.Zhao,N.Wang,H.Shi,H.Wan,J.Huang,Y.Gao,带成本区间优化的超图学习,载于:第三十二届AAAI论文集2-72018,第4522-4529页。
[12] 黄,Y。;刘,Q。;吕,F。;龚,Y。;Metaxas,D.N.,通过超图分区进行无监督图像分类,PAMI,33,6,1266-1273(2011)
[13] 李,X。;胡,W。;沈,C。;Dick,A.R。;Zhang,Z.M.,稳健谱聚类的上下文超图构建,TKDE,26,10,2588-2597(2014)
[14] 黄,S。;Elgammal,A.M。;Yang,D.,关于超边缘权重对超图学习的影响,图像视觉计算。,5789-101(2017)
[15] 东,Z。;王,S。;刘强,复杂网络中基于光谱的社区检测假设检验,信息科学。,512, 1360-1371 (2020) ·Zbl 1457.91305号
[16] 张凯。;Kwok,J.T.,用于大规模流形学习和降维的聚类nyström方法,TNN,21,10,1576-1587(2010)
[17] 李,M。;Bi,W。;Kwok,J.T.(郭,J.T.)。;Lu,B.,使用随机SVD的大尺度nyström核矩阵近似,TNNLS,26,1,152-164(2015)
[18] 贾,H。;丁,S。;杜,M。;Xue,Y.,无特征分解的近似归一化切割,Inf.Sci。,374, 135-150 (2016) ·Zbl 1428.68241号
[19] 蔡,D。;Chen,X.,基于陆地稀疏表示的大规模谱聚类,TCYB,45,8,1669-1680(2015)
[20] Yu,J。;朱,C。;张杰。;黄,Q。;Tao,D.,用于位置识别的带加权三重态损失的空间金字塔增强网络,IEEE Trans。神经网络学习。系统。,31, 2, 661-674 (2020)
[21] 莫汉,M。;Monteleoni,C.,《超越nystrom近似:使用均匀采样和加权核k-means加速光谱聚类》,IJCAI,2494-2500(2017)
[22] M.Vladymyrov,M.á。Carreira-Perpiñán,大规模流形学习的局部线性地标,收录于:ECML PKDD,2013年,第256-271页。doi:10.1007/978-3642-40994-3_17。
[23] 弗拉迪米罗夫,M。;Carreira-Perpiñán,M.á。,用于大规模谱问题的变分nystrom方法,ICML,211-220(2016)
[24] C.洪。;Yu,J。;陶,D。;Wang,M.,通过多视图位置敏感稀疏检索实现基于图像的三维人体姿势恢复,IEEE Trans。工业电子,62,6,3742-3751(2015)
[25] Yu,J。;Tan,M。;张,H。;陶,D。;Rui,Y.,用于细粒度图像识别的分层深度点击特征预测,IEEE模式分析和机器智能汇刊(2019),1-1
[26] F.Tian,B.Gao,Q.Cui,E.Chen,T.Liu,学习图聚类的深度表示,载:C.E.Brodley,P.Stone(编辑),第二十八届AAAI人工智能会议论文集,2014年7月27日至31日,加拿大魁北克市,AAAI出版社,2014年,第1293-1299页。网址:http://www.aaai.org/ocs/index.php/aaai/AAAI14/paper/view/8527。
[27] 张杰。;Yu,J。;Tao,D.,无监督降维的局部深层特征对准,IEEE Trans。图像处理。,27, 5, 2420-2432 (2018) ·Zbl 1409.94749号
[28] B.Perozzi,R.Al-Rfou,S.Skiena,《Deepwalk:在线学习社会表征》,载于:S.A.Macskassy,C.Perlich,J.Leskovec,W.Wang,R.Ghani(编辑),第20届ACM SIGKDD国际知识发现和数据挖掘会议,KDD’14,美国纽约州纽约市-2014年8月24日至27日,ACM,2014年,第701-710页。doi:10.1145/2623330.2623732。网址:doi:10.145/2623330.2623732。
[29] J.Tang,M.Qu,M.Wang,M..Zhang,J.Yan,Q.Mei,LINE:大规模信息网络嵌入,载于:A.Gangemi,S.Leonardi,A.Panconesi(编辑),《第24届万维网国际会议论文集》,WWW 2015,意大利佛罗伦萨,2015年5月18日至22日,ACM,2015年,第1067-1077页。doi:10.1145/2736277.2741093。网址:doi:10.1145/2736277.2741093。
[30] Xu,R。;Che,Y。;王,X。;胡,J。;Xie,Y.,通过集成聚类框架基于堆叠自动编码器的社区检测方法,Inf.Sci。,526, 151-165 (2020)
[31] Sunderrajan,S。;Manjunath,B.S.,用于重新识别和摘要的上下文感知超图建模,TMM,18,1,51-63(2015)
[32] Dhillon,I.S.,使用二部谱图划分对文档和单词进行共聚类,KDD,269-274(2001)
[33] 福克斯,C.C。;Belongie,S.J。;Chung,F.R.K。;Malik,J.,使用nyström方法进行光谱分组,PAMI,26,2,214-225(2004)
[34] M.Li,J.T.Kwok,B.Lu,《使大规模nyströM近似成为可能》,载于:ICML,2010年,第631-638页。
[35] X.Chen,D.Cai,基于地标表示的大规模光谱聚类,载于:AAAI,2011年第5卷,第14页。
[36] 德里尼亚斯,P。;Kannan,R。;Mahoney,M.W.,矩阵的快速蒙特卡罗算法II:计算矩阵的低阶近似,SIAM J.Compute。,36, 1, 158-183 (2006) ·Zbl 1111.68148号
[37] Achlioptas,D。;McSherry,F.,低阶矩阵近似的快速计算,J.ACM,54,2,9(2007)·Zbl 1311.94031号
[38] B.Ghojogh,F.Karray,M.Crowley,特征值和广义特征值问题:教程,arXiv预印本arXiv:1903.11240。
[39] 王,S。;Zhang,Z.,通过自适应采样改进CUR矩阵分解和nyström近似,机器学习研究杂志,14,1,2729-2769(2013),URL:http://dl.acm.org/citation.cfm?id=2567748 ·Zbl 1318.65023号
[40] 刘易斯,D.D。;Yang,Y。;Rose,T.G。;Li,F.,Rcv1:文本分类研究的新基准集合,JMLR,5,2,361-397(2004)
[41] Chen,W。;宋,Y。;Bai,H。;林,C。;Chang,E.Y.,分布式系统中的并行谱聚类,PAMI,33,3,568-586(2011)
[42] 蔡,D。;何,X。;Han,J.,使用局部保持索引的文档聚类,TKDE,17,12,1624-1637(2005)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。