菲利普·乔卓。 具有固定度序列的一致随机多重图的矩。 (英语) Zbl 1483.05154号 SIAM J.数学。数据科学。 2,第4期,1034-1065(2020)。 摘要:我们研究了具有固定次数序列的一致随机多重图的期望邻接矩阵{Z}(Z)_+^n\)。该矩阵出现在对网络数据集的各种分析中,包括模块化最大化和传播过程的平均场理论。对于大型、稀疏、简单的图来说,它的结构很容易理解:节点(i)和(j)之间的预期边数大致为(frac{d_id_j}{sum_\ell{d_ell}})。许多网络数据集既不庞大、稀疏也不简单,在这些情况下,标准近似不再适用。我们使用动力学方法推导了一种新的估计器:该估计器来自一类用于图采样的马尔可夫链蒙特卡罗算法的平稳性条件。我们推导了该估计量的误差界,并提供了一个有效的计算方案。我们在合成度序列和经验度序列上对该估计量进行了测试,发现它相对于地面真实值的相对误差小于标准近似值的一个完整数量级。然后,我们使用标准估计器和新估计器比较模块化最大化技术,发现优化景观的定性结构在很大程度上取决于估计器的选择。我们的结果强调了在数据科学应用中使用精心指定的随机图模型的重要性。 引用于1文件 MSC公司: 05C80号 随机图(图形理论方面) 05C82号 小世界图形、复杂网络(图形理论方面) 91天30分 社交网络;意见动态 65二氧化碳 蒙特卡罗方法 关键词:随机图;社交网络;马尔科夫蒙特卡洛;社区结构;估计 PDF格式BibTeX公司 XML格式引用 \textit{P.S.Chodrow},SIAM J.数学。数据科学。2,编号4,1034--1065(2020;Zbl 1483.05154) 全文: 内政部 arXiv公司 参考文献: [1] G.Amanatidis、B.Green和M.Mihail,联合度矩阵的图形实现,预印本,https://arxiv.org/abs/1509.07076, 2015. ·Zbl 1398.05065号 [2] A.Ambrosetti和P.H.Rabinowitz,临界点理论和应用中的对偶变分方法,J.Funct。分析。,14(1973),第349-381页·Zbl 0273.49063号 [3] O.Angel、R.van der Hofstad和C.Holmgren,配置模型中自循环和多条边的极限定律,预印本,https://arxiv.org/abs/1603.07172, 2016. ·Zbl 1466.60194号 [4] Y.Artzy-Randrup和L.Stone,生成均匀分布的随机网络,Phys。E版,72(2005),056708。 [5] A.Barvinok和J.A.Hartigan,图的数量和具有给定度序列的随机图,《随机结构算法》,42(2013),第301-348页·兹比尔1264.05125 [6] A.R.Benson、R.Abebe、M.T.Schaub、A.Jadbabaie和J.Kleinberg,单纯形闭包和高阶链接预测,Proc。国家。阿卡德。科学。美国,115(2018),第11221-11230页。 [7] R.Bhatia,矩阵分析,梯度。数学课文。169,施普林格,纽约,1997年。 [8] J.Bisgard,《山口和鞍点》,SIAM Rev.,57(2015),第275-292页,https://doi.org/10.1137/10963510。 ·Zbl 1341.58012号 [9] J.Blitzstein和P.Diaconis,生成指定度随机图的序列重要性抽样算法,网络数学。,6(2011年),第489-522页·兹伯利1238.60084 [10] V.D.Blondel、J.-L.Guillaume、R.Lambiotte和E.Lefebvre,《大型网络中社区的快速发展》,J.Stat.Mech。理论实验,10(2008),第1-12页·Zbl 1459.91130号 [11] B.Bollobaís,标记正则图数量渐近公式的概率证明,《欧洲联合杂志》,1(1980),第311-316页·Zbl 0457.05038号 [12] U.Brandes、D.Delling、M.Gaertler、R.Goörke、M.Hoefer、Z.Nikoloski和D.Wagner,《关于寻找具有最大模块性的图簇》,计算机科学中的图论概念国际研讨会,Springer,纽约,2007年,第121-132页·Zbl 1141.68519号 [13] S.Cafeeri、P.Hansen和L.Liberti,网络模块化最大化中的循环和多重边,Phys。E版,81(2010),046102。 [14] C.J.Carstens,快速曲线球算法中行和列和固定的二元矩阵均匀采样的证明,Phys。E版,91(2015),042812。 [15] S.Chatterjee,P.Diaconis和A.Sly,具有给定度序列的随机图,Ann.Appl。概率。,21(2011),第1400-1435页·Zbl 1234.05206号 [16] P.S.Chodrow,随机超图的配置模型,《复杂网络杂志》,8(2020),第1-20页·Zbl 1467.05239号 [17] F.Chung和L.Lu,给定期望度序列的随机图中的连通成分,《Ann.Combin》,6(2002),第125-145页·Zbl 1009.05124号 [18] F.Chung和L.Lu,给定期望度的随机图中的平均距离,Proc。国家。阿卡德。科学。美国,99(2002),第15879-15882页·Zbl 1064.05137号 [19] T.M.Cover和J.A.Thomas,《信息理论的要素》,John Wiley&Sons,纽约,2012年·Zbl 1140.94001号 [20] C.I.Del Genio、H.Kim、Z.Toroczkai和K.E.Bassler,给定任意度序列的简单图的高效精确采样,PloS ONE,5(2010),e10012。 [21] J.-C.Delvenne、S.N.Yaliraki和M.Barahona,《跨时间尺度图社区的稳定性》,Proc。国家。阿卡德。科学。美国,107(2010),第12755-12760页。 [22] P.L.Erdo¨s、C.Greenhill、T.R.Mezei、I.Mikloás、D.Solteász和L.Soukup,交换(交换)马尔可夫链的混合时间:统一方法,预印本,https://arxiv.org/abs/11903.06600, 2019. ·Zbl 1476.60116号 [23] P.Expert、T.S.Evans、V.D.Blondel和R.Lambiotte,《揭示空间网络中的空间依赖社区》,Proc。国家。阿卡德。科学。美国,108(2011),第7663-7668页·Zbl 1256.91043号 [24] S.Fortunato和M.Barthe-lemy,社区检测中的分辨率极限,Proc。国家。阿卡德。科学。美国,104(2006),第36-41页。 [25] B.K.Fosdick、D.B.Larremore、J.Nishimura和J.Ugander,用固定度序列配置随机图模型,SIAM Rev.,60(2018),第315-355页,https://doi.org/10.1137/16M1087175。 ·Zbl 1387.05235号 [26] P.Gao和C.Greenhill,切换马尔可夫链和稳定度序列的混合时间,预印本,https://arxiv.org/abs/2003.08497, 2020. [27] B.H.Good、Y.-A.De Montjoye和A.Clauset,《模块化最大化在实际环境中的表现》,《物理学》。E版,81(2010),046106。 [28] C.Greenhill,采样正则有向图的马尔可夫链混合时间上的多项式界,Electron。J.Combina.,18(2011),234·Zbl 1243.05095号 [29] C.Greenhill,《不规则图采样的开关马尔可夫链》,载于《2015年度ACM-SIAM离散算法研讨会论文集》,ACM,纽约,SIAM,费城,2015年,第1564-1572页,https://doi.org/10.1137/1.9781611973730.103。 ·Zbl 1371.60126号 [30] P.W.Holland和S.Leinhardt,有向图概率分布的指数族,J.Amer。统计师。协会,76(1981),第33-65页·Zbl 0457.62090号 [31] R.A.Horn和C.R.Johnson,《矩阵分析》,剑桥大学出版社,英国剑桥,2012年。 [32] Y.Jabri,《山口定理:变体、推广和一些应用》,《数学百科全书》。申请。95,剑桥大学出版社,英国剑桥,2003年·Zbl 1036.49001号 [33] M.Jerrum和A.Sinclair,正则图的快速一致生成,Theoret。计算。科学。,73(1990年),第91-100页·Zbl 0694.68044号 [34] R.Mastrandrea、J.Fournet和A.Barrat,《高中的接触模式:使用可穿戴传感器、接触日记和友谊调查收集的数据之间的比较》,PLoS ONE,10(2015),e03136497。 [35] B.D.McKay和N.C.Wormald,中等程度随机正则图的统一生成,J.Algorithms,11(1990),第52-67页·Zbl 0711.68082号 [36] M.Molloy和B.Reed,具有给定度序列的随机图的临界点,随机结构算法,6(1995),第161-180页·Zbl 0823.05050号 [37] M.Molloy和B.Reed,具有给定度序列的随机图的巨分量的大小,组合概率。计算。,7(1998年),第295-305页·兹伯利0916.05064 [38] M.E.J.Newman,《网络中的模块化和社区结构》,Proc。国家。阿卡德。科学。美国,103(2006),第8577-8582页。 [39] M.E.J.Newman,模块化优化和社区检测最大似然方法之间的等效性,Phys。E版,94(2016),052315。 [40] M.E.J.Newman和M.Girvan,《发现和评估网络中的社区结构》,物理。E版,69(2004),026113。 [41] M.E.J.Newman、S.H.Strogatz和D.J.Watts,具有任意度分布的随机图及其应用,物理学。E版,64(2001),026118。 [42] J.Reichardt和S.Bornholdt,《社区检测的统计力学》,《物理学》。E版,74(2006),016110·兹比尔1459.91116 [43] A.Rinaldo、S.Petrovicí和S.E.Fienberg,(β)模型中的最大似然估计,Ann.Statist。,41(2013),第1085-1110页·Zbl 1292.62052号 [44] J.Sjo¨strand,通过一系列双边交换简化多重图,预印本,https://arxiv.org/abs/1904.06999, 2019. ·Zbl 1460.05040号 [45] J.Stehleí、N.Voirin、A.Barrat、C.Cattuto、L.Isella、J.-F.Pinton、M.Quaggiotto、W.Van den Broeck、C.Regis、B.Lina和P.Vanhems,《小学面对面接触模式的高分辨率测量》,《公共科学图书馆·综合》,6(2011),e23176。 [46] G.Strona、D.Nappo、F.Boccacci、S.Fattorini和J.San-Miguel-Ayanz,《用固定行和列总数随机化生态二元矩阵的快速无偏程序》,《自然通讯》。,5 (2014), 4114. [47] N.D.Verhelst,《对具有固定边距的二进制矩阵进行采样的有效MCMC算法》,《心理测量学》,73(2008),第705-728页·Zbl 1284.62757号 [48] F.Viger和M.Latapy,具有指定度序列的随机单连通图的高效简单生成,《国际计算与组合数学会议论文集》,Springer,纽约,2005年,第440-449页·Zbl 1128.05312号 [49] P.Zhang和C.Moore,《利用消息传递实现模块化,对具有统计意义的社区和层次结构进行可扩展检测》,Proc。国家。阿卡德。科学。美国,111(2014),第18144-18149页。 [50] X.Zhang和M.E.J.Newman,网络中的多路光谱社区检测,物理。E版,92(2015),052808。 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。