×

加权随机块模型中社区估计的最优比率。 (英语) Zbl 1440.62126号

随机块方法(SBM)的一个重要性质是假设所有边都是二元的。相比之下,许多现实世界网络中出现的边是加权的。研究加权SBM是有道理的。每条边都是由贝努利分布(Bernoulli(p))或贝努利(q))生成的,这取决于其端点是否位于同一社区。主要的理论贡献是刻画了加权SBM中的最佳误聚类误差率。结果表明,加权SBM的社区估计的最优误聚类率受阶Renyi扩散控制在两个混合分布之间捕获社区间和社区内连接的边缘概率和边缘权重密度之间的差异。

MSC公司:

62G07年 密度估算
62H30型 分类和区分;聚类分析(统计方面)
91天30分 社交网络;意见动态
62C20个 统计决策理论中的Minimax过程
90B15号机组 运筹学中的随机网络模型
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abbe,E.(2017)。社区检测和随机块模型:最新发展。J.马赫。学习。决议18第177、86号文件·Zbl 1403.62110号
[2] Abbe,E.、Bandeira,A.S.、Bracher,A.和Singer,A.(2014)。从删失边缘测量解码二进制节点标签:相变和有效恢复。IEEE传输。Netw公司。科学。工程1 10-22。
[3] Abbe,E.、Bandeira,A.S.和Hall,G.(2016)。随机块模型中的精确恢复。IEEE传输。通知。理论62 471-487·Zbl 1359.94047号 ·doi:10.1109/TIT.2015.2490670
[4] Abbe,E.和Sandon,C.(2015)。一般随机块模型中的社区检测:恢复的基本极限和有效算法。在2015年IEEE第56届计算机科学基础年会上—FOCS 2015 670-688。IEEE计算机协会,加利福尼亚州洛斯阿拉米托斯。
[5] Abbe,E.和Sandon,C.(2015)。在不知道参数的情况下恢复一般随机块模型中的群落。神经信息处理系统进展676-684。
[6] Aicher,C.、Jacobs,A.Z.和Clauset,A.(2015)。学习加权网络中的潜在块结构。J.复杂网络。3 221-248·Zbl 1397.68151号 ·doi:10.1093/comnet/cnu026
[7] Balakrishnan,S.、Xu,M.、Krishnamurthy,A.和Singh,A.(2011年)。谱聚类的噪声阈值。神经信息处理系统进展954-962。
[8] Barrat,A.、Barthelemy,M.、Pastor-Satorras,R.和Vespignani,A.(2004)。复杂加权网络的体系结构。程序。国家。阿卡德。科学。美国101 3747-3752。
[9] Blondel,V.D.、Guillaume,J.-L.、Lambiotte,R.和Lefebvre,E.(2008)。大型网络中社区的快速发展。《统计力学杂志》。理论实验10·Zbl 1459.91130号 ·doi:10.1088/1742-5468/2008/10/P10008
[10] Boccaletti,S.、Latora,V.、Moreno,Y.、Chavez,M.和Hwang,D.-U.(2006年)。复杂网络:结构和动力学。物理。代表424 175-308·Zbl 1371.82002号 ·doi:10.1016/j.physrep.2005.10.009
[11] Chin,P.、Rao,A.和Vu,V.(2015)。稀疏图中的随机块模型和社区检测:具有最佳恢复率的谱算法。第28届学习理论会议记录391-423。
[12] Decelle,A.、Krzakala,F.、Moore,C.和Zdeborová,L.(2011年)。模块化网络随机块模型的渐近分析及其算法应用。物理。E 84版。
[13] Easley,D.和Kleinberg,J.(2010年)。网络、人群和市场:关于高度互联世界的推理。剑桥大学出版社,剑桥·Zbl 1205.91007号
[14] Fienberg,S.E.、Meyer,M.M.和Wasserman,S.S.(1985)。多重社会计量关系的统计分析。J.Amer。统计师。协会80 51-67。
[15] Gao,C.、Ma,Z.、Zhang,A.Y.和Zhou,H.H.(2017)。在随机块模型中实现最佳误分类比例。J.马赫。学习。决议18第60、45号论文·Zbl 1440.62244号
[16] Goldenberg,A.、Zheng,A.X.、Fienberg,S.E.和Airoldi,E.M.(2010)。统计网络模型调查。已找到。趋势马赫数。学习。2 129-233. ·Zbl 1184.68030号 ·doi:101561/2200000005
[17] Hajek,B.、Wu,Y.和Xu,J.(2016)。通过半定规划实现精确的集群恢复阈值。IEEE传输。通知。理论62 2788-2797·兹比尔1359.94222 ·doi:10.1109/TIT.2016.2546280
[18] Hajek,B.、Wu,Y.和Xu,J.(2016)。通过半定编程实现精确的集群恢复阈值:扩展。IEEE传输。通知。理论62 5918-5937·Zbl 1359.94951号 ·doi:10.1109/TIT.2016.2594812
[19] Hajek,B.、Wu,Y.和Xu,J.(2017)。恢复隐藏社区的信息限制。IEEE传输。通知。理论63 4729-4745·Zbl 1372.94364号 ·doi:10.1109/TIT.2017.2653804
[20] Hajek,B.、Wu,Y.和Xu,J.(2017)。通过消息传递进行子矩阵定位。J.马赫。学习。决议18第186、52号文件·Zbl 1468.68155号
[21] Hartuv,E.和Shamir,R.(2000年)。一种基于图连通性的聚类算法。通知。过程。莱特。76 175-181. ·Zbl 0996.68525号 ·doi:10.1016/S0020-0190(00)00142-3
[22] Heimlicher,S.、Lelarge,M.和Massoulié,L.(2012)。标记随机块模型中的社区检测。预印。arXiv:1209.2910提供。
[23] Holland,P.W.、Laskey,K.B.和Leinhardt,S.(1983年)。随机块模型:第一步。Soc.网络。5 109-137.
[24] Jackson,M.O.(2008)。社会和经济网络。普林斯顿大学出版社,新泽西州普林斯顿·Zbl 1149.91051号
[25] Jog,V.和Loh,P.(2015)。使用Renyi散度的加权随机块模型中精确恢复的信息论界。预印本。可在arXiv:1509.06418获取。
[26] Lei,J.和Rinaldo,A.(2015)。随机块模型中谱聚类的一致性。Ann.Statist公司。43 215-237·Zbl 1308.62041号 ·doi:10.1214/14-AOS1274
[27] Lelarge,M.、Massoulié,L.和Xu,J.(2015)。标签随机块模型中的重建。IEEE传输。Netw公司。科学。工程2 152-163。
[28] Massoulié,L.(2014)。社区检测阈值和薄弱的Ramanujan属性。在STOC 2014年ACM计算理论研讨会论文集694-703中。纽约ACM·Zbl 1315.68210号
[29] McSherry,F.(2001)。随机图的谱划分。在第42届IEEE计算机科学基础研讨会上(内华达州拉斯维加斯,2001年)529-537。IEEE计算机协会,加利福尼亚州洛斯阿拉米托斯。
[30] Mossel,E.、Neeman,J.和Sly,A.(2012年)。随机块模型和重建。预印本。可在arXiv:1202.1999上获得·Zbl 1350.05154号 ·doi:10.1214/15-AAP1145
[31] Mossel,E.、Neeman,J.和Sly,A.(2014)。二进制对称块模型的一致性阈值。预打印。可从arXiv:1407.1591获取·Zbl 1321.05242号
[32] Mossel,E.、Neeman,J.和Sly,A.(2018年)。块模型阈值猜想的证明。组合数学38 665-708·Zbl 1424.05272号 ·doi:10.1007/s00493-016-3238-8
[33] Newman,M.、Barabási,A.-L.和Watts,D.J.编辑(2006年)。网络的结构和动力学。普林斯顿复杂性研究。普林斯顿大学出版社,新泽西州普林斯顿·Zbl 1362.00042号
[34] Newman,M.E.J.(2004)。加权网络分析。物理。版次E 70。
[35] Newman,M.E.J.和Girvan,M.(2004)。发现和评估网络中的社区结构。物理。修订版E 69。
[36] Pritchard,J.K.、Stephens,M.和Donnelly,P.(2000)。利用多点基因型数据推断种群结构。遗传学155 945-959。
[37] Rubinov,M.和Sporns,O.(2010年)。大脑连接的复杂网络测量:用途和解释。神经影像52 1059-1069。
[38] Sade,D.S.(1972年)。猕猴的社会计量学:I.梳理矩阵中的关联和集团。Folia Primatologica植物18 196-223。
[39] Shi,J.和Malik,J.(2000)。标准化切割和图像分割。IEEE传输。模式分析。机器。智力。888-905.
[40] Xu,M.、Jog,V.和Loh,P.-L(2020年)。补充“加权随机区组模型中社区估计的最佳比率”https://doi.org/10.1214/18-AOS1797SUPP。 ·兹比尔1440.62126
[41] Yun,S.和Proutiere,A.(2016)。标记随机块模型中的最优簇恢复。神经信息处理系统进展965-973。
[42] Zhang,A.Y.和Zhou,H.H.(2016)。随机块模型中社区检测的最小最大速率。Ann.Statist公司。44 2252-2280. ·兹比尔1355.60125 ·doi:10.1214/15-AOS1428
[43] Zhang,B.和Horvath,S.(2005)。加权基因共表达网络分析的一般框架。统计应用程序。遗传学。分子生物学。4第17、45条·Zbl 1077.92042号 ·数字对象标识代码:10.2202/1544-6115.1128
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。