×

稀疏和平滑:动态随机块模型中频谱聚类的改进保证。 (英语) Zbl 07524952号

摘要:在本文中,我们分析了动态随机块模型(DSBM)中谱聚类(SC)算法的经典变体。现有结果表明,在期望度随节点数对数增长的相对稀疏情况下,当DSBM足够大时,静态情况下的保证可以扩展到动态情况,并产生改进的误差界光滑的在时间上,也就是说,社区在两个时间步长之间变化不大。我们通过在DSBM的稀疏性和平滑度之间建立新的联系来改进这些结果:DSBM越平滑,它可以越稀疏,同时仍然保证一致的恢复。特别是,光滑度上的温和条件允许处理稀疏的度有界的情况。这些保证对应用于邻接矩阵或归一化拉普拉斯矩阵的SC有效。作为我们分析的副产品,我们获得了已知的具有独立贝努利项的矩阵的归一化拉普拉斯算子的最佳光谱浓度界。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] ABBE,E.(2018)。社区检测和随机块模型:最新发展。J.马赫。学习。物件。1-86. ·Zbl 1403.62111号 ·数字对象标识代码:10.1561/0100000067
[2] BACH,F.和JORDAN,M.(2006年)。学习频谱聚类,并应用于语音分离。J.马赫。学习。物件。7 1963-2001. ·Zbl 1222.68138号 ·doi:1248547.1248618
[3] Bandeira,A.S.和van Handel,R.(2016)。具有独立项的随机矩阵范数上的尖锐非辛界。安·普罗巴伯。44 2479-2506. ·Zbl 1372.60004号 ·doi:10.1214/15-AOP1025
[4] BHATTACHARYYA,S.和CHATTERJEE,S.(2018年)。多稀疏网络的谱聚类:I。arXiv:1805.10594 1-24.
[5] BRUNA,J.和LI,X.(2017)。用图神经网络进行社区检测。1-15. arXiv:1705.08415v2。
[6] CELISSE,A.、DAUDIN,J.J.和PIERRE,L.(2012)。随机块模型中最大似然估计和变分估计的一致性。电子。J.统计。6 1847-1899. ·Zbl 1295.62028号 ·doi:10.1214/12-EJS729
[7] CHAUDHURI,K.、CHUNG,F.和TSIATAS,A.(2012年)。扩展种植分割模型中一般度图的谱聚类。JMLR公司23 1-23.
[8] CHI,Y.、SONG,X.、ZHOU,D.、HINO,K.和TSENG,B.L.(2007)。结合时间平滑度的进化谱聚类。KDD公司153-162. ·doi:10.1145/1281192.1281212
[9] CHI,Y.、SONG,X.、ZHOU,D.、HINO,K.和TSENG,B.L.(2009)。关于进化谱聚类。ACM T.诺尔。发现。D。3 1-30. ·数字对象标识代码:10.1145/1631162.1631165
[10] CHUNG,F.R.K.(1997年)。谱图论92.美国数学学会。
[11] COUILLET,R.和BENAYCH-GEORGES,F.(2016)。大维数据的核谱聚类。电子。J.统计。10 1393-1454. ·兹比尔1398.62160 ·doi:10.1214/16-EJS1144
[12] DHANJAL,C.、GAUDEL,R.和CLéMEN CHO N,S.(2014)。谱图聚类的有效特征更新。神经计算131 440-452. ·doi:10.1016/j.neucom.2013.11.015
[13] DIAO,P.、GUILLOT,D.、KHARE,A.和RAJARATNAM,B.(2016)。图分区的无模型一致性。arXiv:1608.03860。
[14] GARCíA TRILLOS,N.和SLEP Co EV,D.(2018年)。谱聚类一致性的变分方法。申请。计算。哈蒙。分析。45 239-281. ·Zbl 1396.49013号 ·doi:10.1016/j.acha.2016.09.003
[15] GHASEMIAN,A.、ZHANG,P.、CLAUSET,A.、MOORE,C.和PEEL,L.(2016)。动态网络中社区结构的可检测性阈值和优化算法。物理学。修订版X6 1-9. ·doi:10.10103/物理版本X.6.031005
[16] GOLDENBERG,A.、ZHENG,A.X.、FIENBERG,S.E.和AIROLDI,E.M.(2009)。统计网络模型调查。已找到。趋势马赫数。学习。2 129-233. ·Zbl 1184.68030号 ·doi:10.1561/2200000005
[17] HAN,Q.,XU,K.S.和AIROLDI,E.M.(2015)。动态和多层块模型的一致估计。ICML公司2 1511-1520.
[18] HO,Q.,SONG,L.和XING,E.P.(2011)。时变网络的进化簇混合成员块模型。J.马赫。学习。物件。15 342-350.
[19] 霍兰德,P.W.(1983)。随机块模型:第一步。Soc.网络5 109-137.
[20] 霍姆,第(2015)页。现代时间网络理论:学术讨论会。欧洲物理学。J·B88. ·doi:10.1140/epjb/e2015-60657-4
[21] KRZAKALA,F.、MOORE,C.、MOSSEL,E.、NEEMAN,J.、SLY,A.、ZDEBOROVá,L.和ZHANG,P.(2013)。频谱赎回:集群稀疏网络。程序。国家。阿卡德。科学。美国。1-11. ·Zbl 1359.62252号 ·doi:10.1073/pnas.1312486110
[22] KUMAR,A.、SABHARWAL,Y.和SEN,S.(2004)。任意维k-Means聚类的简单线性时间近似算法。焦点454-462. ·doi:10.1109/FOCS.2004.7
[23] LE,C.M.、LEVINA,E.和VERSHYNIN,R.(2017)。随机图的集中和正则化。随机结构。阿尔戈。51 538-561. ·Zbl 1373.05179号 ·doi:10.1002/rsa.200713
[24] LE,C.M.、LEVINA,E.和VERSHYNIN,R.(2018)。随机图的集中及其在社区检测中的应用。程序。数学国际会议。3 2913-2928. ·Zbl 1448.05179号
[25] LEI,J.和RINALDO,A.(2015)。随机块模型中谱聚类的一致性。Ann.统计。43 215-237. ·兹比尔1308.62041 ·doi:10.1214/14-AOS1274
[26] LEVIE,R.、BRONSTEIN,M.M.和KUTYNIOK,G.(2019年)。谱图卷积神经网络的可传递性。arXiv:1907.12972。
[27] 刘凤、蔡德、谢立和罗德(2018)。动态网络中的全局谱聚类。程序。国家。阿卡德。科学。美国。115 927-932. ·Zbl 1418.91430号 ·doi:10.1073/pnas.1718449115
[28] Lloyd,S.P.(1982)。PCM中的最小二乘量化。IEEE传输。Inf.理论28 129-137. ·Zbl 0504.94015号 ·doi:10.10109/TIT.1982.1056489
[29] LONGEPIERRE,L.和MATIAS,C.(2019年)。动态随机块模型中最大似然估计和变分估计的一致性。电子。J.统计。13 4157-4223. ·兹比尔1433.62162 ·doi:10.1214/19-EJS1624
[30] MATIAS,C.和MIELE,V.(2017年)。通过动态随机块模型对时间网络进行统计聚类。J.R.Stat.Soc.B公司79 1119-1141. ·Zbl 1373.62312号 ·doi:10.1111/rssb.12200
[31] MOSSEL,E.、NEEMAN,J.和SLY,A.(2017年)。块模型阈值猜想的证明。组合数学1-44. ·Zbl 1424.05272号 ·doi:10.1007/s00493-016-3238-8
[32] NG,A.Y.、JORDAN,M.I.和WEISS,Y.(2001)。关于光谱聚类:分析和算法。NIPS公司849-856. ·数字对象标识代码:10.1.1.19.8100
[33] NING,H.、XU,W.、CHI,Y.、GONG,Y.和HUANG,T.(2007)。增量谱聚类及其在博客社区发展监测中的应用。261-272. ·doi:10.1137/1.9781611972771.24
[34] OLIVEIRA,R.I.(2009)。具有独立边的随机图中邻接矩阵和拉普拉斯算子的集中。arXiv:0911.0600。
[35] PAUL,S.和CHEN,Y.(2020年)。用于多层网络中一致社区检测的谱和矩阵分解方法。Ann.统计。48 230-250. ·Zbl 1440.62091号 ·doi:10.1214/18-AOS1800
[36] PENG,R.、SUN,H.和ZANETTI,L.(2015)。划分良好聚类图:谱聚类有效!40 1-33. ·Zbl 1370.05204号
[37] Pensky,M.和Zhang,T.(2019年)。动态随机块模型中的谱聚类。电子。J.统计。13 678-709. ·Zbl 1415.62046号 ·doi:10.1214/19-ejs1533
[38] ROHE,K.、CHATTERJEE,S.和YU,B.(2011)。谱聚类和高维随机块模型。Ann.统计。39 1878-1915. ·Zbl 1227.62042号 ·doi:10.1214/11-AOS887
[39] SARKAR,P.和BICKEL,P.J.(2015)。归一化在随机块模型谱聚类中的作用。Ann.统计。43 962-990. ·Zbl 1320.62150号 ·doi:10.1214/14-aos1285
[40] TANG,M.和PRIEBE,C.E.(2018年)。随机图的归一化拉普拉斯特征向量的极限定理。Ann.统计。46 2360-2415. ·兹比尔1408.62120 ·doi:10.1214/17-AOS1623
[41] TREMBLAY,N.和LOUKAS,A.(2020年)。通过采样近似光谱聚类:综述。监督或非监督任务的抽样技术129-183. 斯普林格·Zbl 1436.62446号
[42] von Luxburg,U.(2007年)。光谱聚类教程。统计计算。17 395-416. ·数字对象标识代码:10.1007/s11222-007-9033-z
[43] VON LUXBURG,U.、BELKIN,M.和BOUSQUET,O.(2008)。谱聚类的一致性。Ann.统计。36 555-586. ·Zbl 1133.62045号 ·doi:10.1214/009053607000000640
[44] WANG,Y.、CHAKRABARTI,A.、SIVAKOFF,D.和PARTHASARATHY,S.(2017年)。动态社交网络中的快速变化点检测。国际JCAI2992-2998. ·数字对象标识代码:10.1145/3091478.3091493
[45] XU,D.和KNIGHT,J.(2010)。正态参数混合的连续经验特征函数估计。经济。修订版。30 25-50. ·Zbl 1209.62052号 ·doi:10.1080/07474938.2011.520565
[46] XU,K.S.(2015)。动态网络的随机块转移模型。AISTAT公司1-23.
[47] XU,K.S.和HERO,A.O.(2014)。时间演化社交网络的动态随机块模型。IEEE J.选择。主题信号处理。8 552-562. ·doi:10.1109/JSTSP.2014.2310294
[48] XU,K.S.、KLIGER,M.和III,A.O.H.(2010)。具有自适应遗忘因子的进化谱聚类。ICASSP公司2174-2177.
[49] YANG,T.、CHI,Y.、ZHU,S.、GONG,Y.和JIN,R.(2011)。检测动态社交网络中的社区及其演变-贝叶斯方法。机器。学习。82 157-189. ·Zbl 1237.91189号 ·doi:10.1007/s10994-010-5214-7
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。