×

非均匀超图的非回溯谱聚类。 (英语) Zbl 1517.05096号

摘要:谱方法通过对图矩阵的特征向量计算,为图中的聚类提供了一个易于处理的全局框架。超图数据中,实体在任意大小的边上交互,这对矩阵表示和谱聚类提出了挑战。我们基于超图非回溯算子研究非均匀超图的谱聚类。在回顾了该算子的定义及其基本性质之后,我们证明了一个Ihara-Buss型定理,该定理允许在较小的矩阵上进行本征对计算,通常可以实现更快的计算。然后,我们通过线性化的置信传播提出了一种用于超图随机块模型中推理的交替算法,该算法再次使用非回溯算子进行谱聚类。我们提供了与该算法相关的证明,这些证明形式化并扩展了先前的几个结果。一般来说,我们对超图随机块模型中谱方法和可检测性的局限性提出了几个猜想,并通过对算子特征对的期望分析来支持这些猜想。我们在真实数据和合成数据中进行了实验,证明了当不同大小的交互携带关于簇结构的不同信息时,超图方法相对于基于图形的方法的优点。

MSC公司:

05元50分 图和线性代数(矩阵、特征值等)
05年6月15日 Hypergraphs(Hypergraph)
15甲18 特征值、奇异值和特征向量
62H30型 分类和区分;聚类分析(统计方面)
62兰特 大数据和数据科学的统计方面
91天30分 社交网络;意见动态
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abbe,E.,《社区检测和随机块模型:最新发展》,J.Mach。学习。第18号决议(2017年),第6446-6531页·Zbl 1403.62110号
[2] Aktas,M.E.、Nguyen,T.、Sidra,J.、Rakin,R.和Esra,A.,《识别复杂网络中的关键高阶交互作用》,科学。众议员,11(2021),21288,doi:10.1038/s41598-021-00017-y。
[3] Alon,N.,Benjamini,I.,Lubetzky,E.和Sodin,S.,非跟踪随机行走混合更快,Commun。康斯坦普。数学。,9(2007),第585-603页·兹比尔1140.60301
[4] Angelini,M.C.、Caltagirone,F.、Krzakala,F.和Zdeborová,L.,稀疏超图的谱检测,载于第53届通信、控制和计算(Allerton)年度Allerton会议论文集。IEEE,2015年,第66-73页。
[5] Bass,H.,树晶格的Ihara-Selberg zeta函数,国际。数学杂志。,3(1992年),第717-797页·Zbl 0767.11025号
[6] Battiston,F.、Cencetti,G.、Iacopini,I.、Latora,V.、Lucas,M.、Patania,A.、Young,J.-G和Petri,G.,《超越两两交互的网络:结构和动力学》,《物理学》。众议员,874(2020),第1-92页,doi:10.1016/j.physrep.2020.05.004·Zbl 1472.05143号
[7] Battiston,F.、Amico,E.、Barrat,A.、Bianconi,G.、Ferraz de Arruda,G.,Franceschiello,B.、Iacopini,I.、Kéfi,S.、Latora,V.、Moreno,Y.等人,《复杂系统中高阶相互作用的物理》,《自然物理学》。,17(2021),第1093-1098页。
[8] Beckenbach,E.F.和Bellman,R.,《不平等》,施普林格,柏林,2011年。
[9] Benson,A.R.、Abebe,R.、Schaub,M.T.、Jadbabaie,A.和Kleinberg,J.,《单纯形闭包和高阶链接预测》,Proc。国家。阿卡德。科学。美国,115(2018),第E11221-E11230页,doi:10.1073/pnas.18000683115。
[10] Bergström,H.,矩阵的三角不等式,载于Den Elfte Skandinaviske Matematikerkongress,挪威特隆赫姆,1949年,第264-267页·Zbl 0049.29501号
[11] Bezanson,J.、Edelman,A.、Karpinski,S.和Shah,V.B.,Julia:数值计算的新方法,SIAM Rev.,59(2017),第65-98页,doi:10.1137/141000671·Zbl 1356.68030号
[12] Bick,C.、Gross,E.、Harrington,H.A.和Schaub,M.T.,什么是高阶网络?,预印本,https://arxiv.org/abs/1204.11329, 2021.
[13] Bishop,C.M.,模式识别和机器学习,Springer,纽约,2006年·Zbl 1107.68072号
[14] Blondel,V.D.、Guillaume,J.-L.、Lambiotte,R.和Lefebvre,E.,《大型网络中社区的快速发展》,J.Stat.Mech。理论实验,2008(2008),P10008·Zbl 1459.91130号
[15] Bojanek,K.、Zhu,Y.和MacLean,J.,高阶基序之间的循环转换是稀疏递归网络中持续异步峰值的基础,PLos Compute。《生物学》,16(2020),e1007409。
[16] Bordenave,C.、Lelarge,M.和Massoulié,L.,《随机图的非回溯谱:社区检测和非正则ramanujan图》,摘自IEEE第56届计算机科学基础年会论文集,IEEE,2015年,第1347-1357页。
[17] Caplar,N.、Tacchella,S.和Birrer,S.,《从引用计数定量评估天文出版物中的性别偏见》,《国家天文学》,1(2017),第1-5页。
[18] Chang,J.,Chen,Y.,Qi,L.,and Yan,H.,使用新拉普拉斯张量的超图聚类及其在图像处理中的应用,SIAM J.Imaging Sci。,13(2020年),第1157-1178页,doi:10.1137/19M1291601·Zbl 1451.05136号
[19] Chodrow,P.S.,随机超图的配置模型,J.Complex Networks,8(2020),cnaa018·Zbl 1467.05239号
[20] Chodrow,P.S.、Veldt,N.和Benson,A.R.,《生成超图聚类:从块模型到模块化》,科学版。高级,7(2021),eabh1303。
[21] Contisciani,M.、Battiston,F.和De Bacco,C.,超图中超边和重叠社区的原则推断,预印本,https://arxiv.org/abs/2204.05646v1, 2022.
[22] Coste,S.和Zhu,Y.,与本体分离的非回溯算子的特征值,随机矩阵理论应用。,10(2021),2150028,doi:10.1142/S2010326321500283·Zbl 1483.60012号
[23] Dall'Amico,L.、Couillet,R.和Tremblay,N.,稀疏图中谱聚类的统一框架,J.Mach。学习。研究,22(2021),第1-56页·Zbl 07626732号
[24] Decelle,A.、Krzakala,F.、Moore,C.和Zdeborová,L.,模块化网络随机块模型及其算法应用的渐近分析,Phys。E版,84(2011),066106。
[25] Dembo,A.和Montanari,A.,Gibbs在稀疏随机图上测量和相变,Braz。J.概率。Stat.,24(2010),第137-211页,doi:10.1214/09-BJPS027·Zbl 1205.05209号
[26] Dembo,A.和Montanari,A.,Ising在局部树状图上的模型,Ann.Appl。概率。,20(2010),第565-592页,doi:10.1214/09-AAP627·兹比尔1191.82025
[27] Dempster,A.P.、Laird,N.M.和Rubin,D.B.,《通过EM算法从不完整数据中获得最大似然》,J.R.Stat.Soc.Ser。B方法。,39(1977年),第1-38页·Zbl 0364.62022号
[28] Dion,M.L.、Sumner,J.L.和Mitchell,S.M.,《跨政治科学和社会科学方法论领域的性别引用模式》,《政治分析》。,26(2018),第312-327页。
[29] Dumitriu,I.,Wang,H.和Zhu,Y.,非均匀超图随机块模型中的部分恢复和弱一致性,预印本,https://arxiv.org/abs/2112.11671, 2021.
[30] Dworkin,J.、Zurn,P.和Bassett,D.S.(In),引用实现公平未来的行动,《神经元》,106(2020),第890-894页。
[31] Dworkin,J.D.、Linn,K.A.、Teich,E.G.、Zurn,P.、Shinohara,R.T.和Bassett,D.S.,《神经科学参考列表中性别失衡的程度和驱动因素》,《国家神经科学》。,23(2020年),第918-926页。
[32] Fowler,J.H.,《连接国会:联合赞助网络研究》,《政治分析》。,14(2006年),第456-487页。
[33] Fowler,J.H.,《美国众议院和参议院的立法共同赞助网络》,《社会网络》,28(2006),第454-465页。
[34] Galuppi,F.,Mulas,R.和Venturello,L.,通过张量的加权超图的谱理论,预印本,https://arxiv.org/abs/2106.00277, 2021. ·Zbl 1512.05309号
[35] Ghoshdastidar,D.和Dukkipati,A.,种植分割模型下谱超图分割的一致性,Ann.Statist。,45(2017),第289-315页,doi:10.1214/16-AOS1453·Zbl 1360.62330号
[36] Hu,J.和Wang,M.,通过度校正张量块模型的多向球面聚类,预印本,https://arxiv.org/abs/2201.07401, 2022.
[37] Ihara,Y.,《关于p-adic域上二乘二射影线性群的离散子群》,J.Math。《日本社会》,18(1966),第219-235页·Zbl 0158.27702号
[38] Jost,J.和Mulas,R.,实数系数超图的规范化拉普拉斯算子,J.复杂网络,9(2021),cnab009,doi:10.1093/comnet/·兹比尔1472.05118
[39] Kawamoto,T.,随机块模型的算法可检测性阈值,Phys。E版,97(2018),032301,doi:10.1103/PhysRevE.97.032301。
[40] Ke,Z.T.,Shi,F.和Xia,D.,通过正则张量幂迭代对超图网络进行社区检测,预印本,https://arxiv.org/abs/1909.06503, 2019.
[41] Kempton,M.C.,《非回溯随机游动和加权Ihara定理》,开放J.离散数学。,6(2016),第207-226页。
[42] Kirkley,A.、Cantwell,G.T.和Newman,M.E.J.,《带回路网络的信念传播》,科学。高级,7(2021),doi:10.1126/sciadv.abf1211。
[43] Krzakala,F.、Moore,C.、Mossel,E.、Neeman,J.、Sly,A.、Zdeborová,L.和Zhang,P.,《集群稀疏网络中的谱赎回》,Proc。国家。阿卡德。科学。美国,110(2013),第20935-20940页·Zbl 1359.62252号
[44] Lei,J.和Rinaldo,A.,随机块模型中谱聚类的一致性,Ann.Statist。,43(2015),第215-237页·Zbl 1308.62041号
[45] Lim,L.-H.,《张量的奇异值和特征值:变分方法》,载于IEEE第一届多传感器自适应处理计算进展国际研讨会论文集,IEEE,2005年,第129-132页。
[46] Llorens,A.,Tzovara,A.,Bellier,L.,Bhaya-Grossman,I.,Bidet-Caulet,A.,Chang,W.K.,Cross,Z.R.,Dominguez-Faus,R.,Flinker,A.,Fonken,Y.等人,《学术界的性别偏见:需要解决的终身问题》,《神经元》,109(2021),第2047-2074页。
[47] MacQueen等人,J.,《多元观测分类和分析的一些方法》,载于《第五届伯克利数理统计与概率研讨会论文集》,第1卷,加利福尼亚州奥克兰,1967年,第281-297页·Zbl 0214.46201号
[48] Maliniak,D.、Powers,R.和Walter,B.F.,《国际关系中的性别引用差距》,国际机关。,67(2013),第889-922页。
[49] Martin,T.、Zhang,X.和Newman,M.E.,《网络中的本地化和中心性》,《物理学》。E版,90(2014),052808。
[50] Massoulié,L.,《社区检测阈值和弱Ramanujan属性》,载于《第四十六届ACM计算理论研讨会论文集》,ACM,纽约,2014年,第694-703页·Zbl 1315.68210号
[51] Mastrandrea,R.、Fournet,J.和Barrat,A.,《高中接触模式:使用可穿戴传感器、接触日记和友谊调查收集的数据之间的比较》,《公共科学图书馆·综合》,10(2015),e0136497,doi:10.1371/journal.pone.0136497。
[52] Mellor,A.和Grusovin,A.,通过非回溯谱进行图形比较,Phys。E版,99(2019),052309。
[53] Mossel,E.、Neeman,J.和Sly,A.,《种植分区模型中的重建和估算》,Probab。理论相关领域,162(2015),第431-461页·Zbl 1320.05113号
[54] Mossel,E.、Neeman,J.和Sly,A.,块模型阈值猜想的证明,组合数学,38(2018),第665-708页·Zbl 1424.05272号
[55] Mulas,R.和Zhang,D.,有向超图上拉普拉斯算子的谱理论,离散数学。,344(2021),112372,doi:10.1016/j.disc.2021.112372·Zbl 07340597号
[56] Mulas,R.、Kuehn,C.、Böhle,T.和Jost,J.,超图上的随机行走和拉普拉斯:它们何时匹配?,预印本,https://arxiv.org/abs/2106.11663, 2021. ·Zbl 1514.37057号
[57] Nadkuditi,R.R.和Newman,M.E.,图谱和网络中群落结构的可检测性,Phys。修订稿。,108 (2012), 188701.
[58] Newman,M.E.,《网络中的模块化和社区结构》,Proc。国家。阿卡德。科学。美国,103(2006),第8577-8582页。
[59] Porter,M.A.、Onnela,J.-P.和Mucha,P.J.,《网络中的社区》,美国通告。数学。Soc.,56(2009),第1082-1097页·Zbl 1188.05142号
[60] 核心团队,R,R:统计计算的语言和环境,R统计计算基金会,奥地利维也纳,2022年。
[61] Ramani,A.S.、Eikmeier,N.和Gleich,D.F.,用于从边缘概率矩阵生成随机图的抛硬币、抛球和打草,SIAM Rev.,61(2019),第549-595页,doi:10.1137/17M1127132·Zbl 1419.05194号
[62] Saad,Y.,《大型特征值问题的数值方法》,修订版,SIAM,费城,2011年,doi:10.1137/1.9781611970739·Zbl 1242.65068号
[63] Salez,J.,稀疏随机图局部弱收敛的一些含义,巴黎第六大学博士论文;巴黎高等师范学院,法国巴黎,2011年。
[64] Sebesyen,G.S.,《模式识别中的决策过程》,麦克米伦出版社,纽约,1962年。
[65] Shi,J.和Malik,J.,标准化切割和图像分割,IEEE Trans。模式分析。机器。英特尔。,22(2000),第888-905页。
[66] Stehlé,J.、Voirin,N.、Barrat,A.、Cattuto,C.、Isella,L.、Pinton,J.-F.、Quaggiotto,M.、Van den Broeck,W.、Régis,C.、Lina,B.和Vanhems,P.,《小学面对面接触模式的高分辨率测量》,《公共科学图书馆·综合》,6(2011),e23176,doi:10.1371/journal.pone.0023176。
[67] Stephan,L.和Zhu,Y.,稀疏随机超图:非回溯谱和社区检测,预印本,https://arxiv.org/abs/2203.07346, 2022.
[68] Storm,C.K.,超图的zeta函数,电子。J.Combin.,13(2006),R84,doi:10.37236/1110·Zbl 1112.05072号
[69] Teich,E.G.,Kim,J.Z.,Lynn,C.W.,Simon,S.C.,Klishin,A.A.,Szymula,K.P.,Srivastava,P.,Bassett,L.C.,Zurn,P..,Dworkin,J.D.,and Bassett,https://arxiv.org/abs/2112.09047, 2021.
[70] Torres,L.、Suárez-Serrator,P.和Eliassi-Rad,T.,《非回溯周期:长度谱理论和图挖掘应用》,应用。Netw公司。科学。,4(2019),41,doi:10.1007/s41109-019-0147-y。
[71] Torres,L.,Chan,K.S.,Tong,H.和Eliassi-Rad,T.,《节点移除下的非回溯特征值:X中心性和靶向免疫》,SIAM J.Math。数据科学。,3(2021),第656-675页,doi:10.1137/20M1352132·Zbl 1470.05107号
[72] Von Luxburg,U.,《光谱聚类教程》,统计计算。,17(2007),第395-416页。
[73] Von Luxburg,U.、Belkin,M.和Bousquet,O.,《谱聚类的一致性》,《统计年鉴》。,36(2008年),第555-586页·Zbl 1133.62045号
[74] Wang,X.、Dworkin,J.D.、Zhou,D.、Stiso,J.、Falk,E.B.、Bassett,D.S.、Zurn,P.和Lydon-Staley,D.M.,《传播领域的性别引用实践》,Ann.Int.Commun。协会,45(2021),第134-153页。
[75] Wickham,H.,ggplot2:数据分析的优雅图形,Springer Verlag,纽约,2016·兹比尔1397.62006
[76] Zhou,D.、Huang,J.和Schölkopf,B.,《超图学习:聚类、分类和嵌入》,in,NIPS 2006,NeurIPS,加州圣地亚哥,2006,第1601-1608页。
[77] Zurn,P.、Bassett,D.S.和Rust,N.C.,《引用多样性声明:透明的实践,一种生活方式》,Trends Cogn。科学。,24(2020年),第669-672页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。