×

使用光谱方法检测网络中的重叠社区。 (英语) Zbl 1484.62073号

总结:社区检测在网络分析中已经得到了很好的研究,但更现实的重叠社区的情况仍然是一个挑战。在这里,我们提出了一个通用的、灵活的、可解释的重叠社区生成模型,它可以被视为以不同的方式概括了以前的几个模型。我们开发了一种有效的谱算法来估计社区成员,该算法通过使用(K)-中位数算法而不是通常的谱域聚类平均值来处理重叠。我们表明,当网络不太稀疏且社区之间的重叠不太大时,该算法是渐近一致的。在模拟网络和许多真实社交网络上的数值实验表明,与许多用于重叠社区检测的基准方法相比,我们的方法表现良好。

MSC公司:

62H22个 概率图形模型
62H30型 分类和区分;聚类分析(统计方面)
2012年12月62日 参数估计量的渐近性质
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] E.M.Airoldi、D.M.Blei、S.E.Fienberg和E.P.Xing,混合成员随机块模型,J.Mach。学习。Res.,9(2008),第1981-2014页·兹比尔1225.68143
[2] A.A.Amini、A.Chen、P.J.Bickel和E.Levina,大型稀疏网络中社区检测的伪似然方法,Ann.Statist。,41(2013),第2097-2122页·Zbl 1277.62166号
[3] A.Anandkumar、R.Ge、D.Hsu和S.M.Kakade,学习混合成员社区模型的张量方法,J.Machine Learn。Res.,15(2014),第2239-2312页·Zbl 1318.68136号
[4] B.Ball、B.Karrer和M.E.J.Newman,一种有效且有原则的网络社区检测方法,Phys。E版,34(2011),036103。
[5] P.J.Bickel和A.Chen,网络模型和Newman-Girvan及其他模块的非参数视图,Proc。国家。阿卡德。科学。美国,106(2009),第21068-21073页·Zbl 1359.62411号
[6] P.J.Bickel和P.Sarkar,网络中自动社区检测的假设测试,J.R.Stat.Soc.Ser。B统计方法。,78(2016),第253-273页·Zbl 1411.62162号
[7] H.Bolouri和E.H.Davidson,“群落效应”的基因调控网络基础,海胆胚胎实例分析,发育生物学。,340(2010),第170-178页。
[8] 蔡洪涛,李晓霞,存在任意离群节点的鲁棒和计算可行社区检测,Ann.Statist。,43(2015),第1027-1059页·Zbl 1328.62381号
[9] B.L.Chamberlain,分布并行计算工作负载的图形分区算法,华盛顿大学技术报告UW-CSE-98-10,3,西雅图,华盛顿州,1998年。
[10] K.Chaudhuri、F.C.Graham和A.Tsiatas,扩展种植分割模型中具有一般度的图的谱聚类,《第25届学习理论年会论文集》,苏格兰爱丁堡,2012,35。
[11] K.Chen和J.Lei,确定网络数据中社区数量的网络交叉验证,J.Amer。统计师。协会,113(2018),第241-251页·Zbl 1398.62159号
[12] 陈寅,李晓霞,徐建军,度修正随机块模型的凸模块最大化,统计年鉴。,46(2018),第1573-1602页·Zbl 1410.62105号
[13] D.S.Choi、P.J.Wolfe和E.M.Airoldi,类数量不断增加的随机块模型,Biometrika,99(2012),第273-284页·Zbl 1318.62207号
[14] A.Decelle、F.Krzakala、C.Moore和L.Zdeborovaí,模块化网络随机块模型及其算法应用的渐近分析,Phys。E版,84(2011),066106。
[15] S.Fortunato,《图形中的社区检测》,Phys。众议员,486(2010),第75-174页。
[16] C.Gao,Z.Ma,A.Y.Zhang,H.H.Zhou,度校正块模型中的社区检测,Ann.Statist。,46(2018),第2153-2185页·Zbl 1408.62116号
[17] N.Gillis和S.Vavasis,可分离非负矩阵分解的快速鲁棒递归算法,IEEE Trans。模式分析。机器。智力。,36(2014),第698-714页·Zbl 1316.15015号
[18] A.Goldenberg、A.X.Zheng、S.E.Fienberg和E.M.Airoldi,《统计网络模型调查》,Found。趋势马赫数。学习。,2(2010年),第129-233页·Zbl 1184.68030号
[19] S.Gregory,《通过标签传播发现网络中重叠的社区》,《新物理学杂志》。,12 (2010), 103018. ·Zbl 1448.90094号
[20] B.Hendrickson和T.G.Kolda,并行计算的图形分区模型,并行计算。,26(2000),第1519-1534页·Zbl 0948.68130号
[21] P.W.Holland、K.B.Laskey和S.Leinhardt,《随机区块模型:第一步》,社交网络,5(1983),第109-137页。
[22] P.W.Holland和S.Leinhardt,有向图概率分布的指数族,J.Amer。统计师。协会,76(1981),第33-50页·Zbl 0457.62090号
[23] A.Hollocou、T.Bonald和M.Lelarge,基于模块的稀疏软图聚类,AISTATS 2019,日本冲绳,2019。
[24] S.B.Hopkins和D.Steurer,《少数样本的有效贝叶斯估计:社区检测和相关问题》,载于第58届IEEE计算机科学基础年度研讨会论文集,IEEE,华盛顿特区,2017,第379-390页。
[25] J.Jin,通过分数快速社区检测,Ann.Statist。,43(2015),第57-89页·Zbl 1310.62076号
[26] J.Jin和Z.T.Ke,混合成员估计的一个尖锐下限,预印本,https://arxiv.org/abs/1709.05603, 2017.
[27] J.Jin、Z.T.Ke和S.Luo,通过单纯形顶点搜索估计网络成员,预印本,https://arxiv.org/abs/1708.07852, 2017.
[28] A.Joseph和B.Yu,正则化对谱聚类的影响,Ann.Statist。,44(2016),第1765-1791页·Zbl 1357.62229号
[29] B.Karrer和M.E.Newman,网络中的随机块模型和社区结构,物理。E版,83(2011),016107。
[30] E.Kaufmann、T.Bonald和M.Lelarge,用于恢复网络中重叠社区的加性聚类谱算法,《算法学习理论国际会议论文集》,纽约斯普林格,2016年,第355-370页·Zbl 1398.68441号
[31] A.Lancichinetti、S.Fortunato和J.Kerteász,《检测复杂网络中重叠和层级社区结构》,《新物理学杂志》。,11 (2009), 033015.
[32] A.Lancichinetti、F.Radichi、J.J.Ramasco和S.Fortunato,《发现网络中具有统计意义的社区》,《公共科学图书馆·综合》,6(2011),e18961。
[33] P.Latouche、E.Birmeleí和C.Ambroise,重叠随机块模型,预印本,https://arxiv.org/abs/0910.2098v1, 2009. ·Zbl 1349.62276号
[34] C.M.Le和E.Levina,用谱方法估计网络中的社区数量,预印本,https://arxiv.org/abs/11507.00827, 2015.
[35] C.M.Le、E.Levina和R.Vershynin,通过低阶近似优化网络中的社区检测,Ann.Statist。,44(2016),第373-400页·Zbl 1331.62312号
[36] J.Leskovec和J.J.Mcauley,《学习发现自我网络中的社交圈》,摘自《神经信息处理系统进展》,内华达州塔霍湖,2012年,第539-547页。
[37] T.Li、E.Levina和J.Zhu,边缘采样网络交叉验证,预印本,https://arxiv.org/abs/1612.04717, 2016. ·Zbl 1441.62049号
[38] D.Lusseau、K.Schneider、O.J.Boisseau、P.Haase、E.Slooten和S.M.Dawson,声音可疑的宽吻海豚群落具有很大比例的长期联系,行为生态学。Sociobiol.公司。,54(2003),第396-405页。
[39] X.Mao、P.Sarkar和D.Chakrabarti,估计具有尖锐特征向量偏差的混合成员,预印本,https://arxiv.org/abs/1709.00407, 2017.
[40] X.Mao、P.Sarkar和D.Chakrabarti,《关于混合成员和对称非负矩阵因式分解》,第34届机器学习国际会议论文集,第70卷,JMLR,澳大利亚悉尼,2017年,第2324-2333页。
[41] X.Mao、P.Sarkar和D.Chakrabarti,《重叠聚类模型和一类SVM将它们结合在一起》,《神经信息处理系统进展》,加拿大蒙特利尔,2018,第2126-2136页。
[42] E.Mossel、J.Neeman和A.Sly,二元对称块模型的一致性阈值,预印本,https://arxiv.org/abs/1407.1591v1, 2014. ·Zbl 1321.05242号
[43] M.E.Newman和M.Girvan,《发现和评估网络中的社区结构》,《物理学》。E版,69(2004),026113。
[44] M.E.J.Newman,网络社区检测和图形划分的光谱方法,物理。E版,88(2013),042822。
[45] T.L.J.Ng和T.B.Murphy,广义随机点积图,统计学家。普罗巴伯。莱特。,148(2019),第143-149页,https://doi.org/10.1016/j.spl.2019.01.011。 ·Zbl 1442.60017号
[46] C.L.M.Nickel,《随机点积图:社交网络模型》,博士论文,约翰霍普金斯大学,马里兰州巴尔的摩,2007年。
[47] G.Palla、I.Dereínyi、I.Farkas和T.Vicsek,《揭示自然界和社会中复杂网络的重叠社区结构》,《自然》,435(2005),第814-818页。
[48] C.Pizzuti,复杂网络中的重叠社区检测,《第十一届遗传和进化计算年会论文集》,美国计算机学会,纽约,2009年,第859-866页。
[49] I.Psorakis、S.Roberts、M.Ebden和B.Sheldon,使用贝叶斯非负矩阵分解的重叠社区检测,Phys。E版,83(2011),066114。
[50] T.Qin和K.Rohe,度校正随机块模型下的正则谱聚类,《神经信息处理系统进展》,内华达州塔霍湖,2013年,第3120-3128页。
[51] M.D.Resnick、P.S.Bearman、R.W.Blum、K.E.Bauman、K.M.Harris、J.Jones、J.Tabor、T.Beuhring、R.E.Sieveng和M.Shew,《保护青少年免受伤害:国家青少年健康纵向研究的发现》,JAMA,278(1997),第823-832页。
[52] K.Rohe、S.Chatterjee和B.Yu,谱聚类和高维随机块模型,Ann.Statist。,39(2011),第1878-1915页·Zbl 1227.62042号
[53] P.Rubin-Delhancy、C.E.Priebe和M.Tang,混合成员随机块模型邻接谱嵌入的一致性,预印本,https://arxiv.org/abs/1705.04518, 2017.
[54] D.F.Saldana、Y.Yu和Y.Feng,有多少社区?,预印本,https://arxiv.org/abs/1412.1684, 2014.
[55] P.Sarkar和P.J.Bickel,规范化在随机块模型光谱聚类中的作用,预印本,https://arxiv.org/abs/1310.1495, 2013. ·Zbl 1320.62150号
[56] M.Tang和C.E.Priebe,随机图的归一化拉普拉斯特征向量的极限定理,Ann.Statist。,46(2018),第2360-2415页·兹比尔1408.62120
[57] U.Von Luxburg,光谱聚类教程,统计计算。,17(2007),第395-416页。
[58] F.Wang、T.Li、X.Wang、S.Zhu和C.Ding,使用非负矩阵因式分解的社区发现,Data Min.Knowl。发现。,22(2011),第493-521页·Zbl 1235.68034号
[59] X.Wen,W.-N.Chen,Y.Lin,T.Gu,H.Zhang,Y.Li,Y.Yin,and J.Zhang.《基于最大团的重叠社区检测多目标进化算法》,IEEE Trans。进化。计算。,21(2016),第363-377页。
[60] J.J.Whang、D.F.Gleich和I.S.Dhillon,使用邻居膨胀种子扩展进行重叠社区检测,IEEE Trans。知识。数据工程,28(2016),第1272-1284页。
[61] J.Xie、S.Kelley和B.K.Szymanski,《网络中的重叠社区检测:最先进和比较研究》,ACM Compute。调查,45(2013),43·Zbl 1288.68191号
[62] S.J.Young和E.R.Scheinerman,《社交网络的随机点积图模型》,收录于《网络图的算法和模型》,施普林格,纽约,2007年,第138-149页·Zbl 1136.05322号
[63] W.W.Zachary,《小群体冲突和分裂的信息流模型》,J.人类学。研究,33(1977),第452-473页。
[64] A.Zhang,《蛋白质相互作用网络:计算分析》,剑桥大学出版社,英国剑桥,2009年·Zbl 1320.92021
[65] 张亚勇,周海宏,随机区组模型中社区检测的最小极大率,Ann.Statist。,44(2016),第2252-2280页·Zbl 1355.60125号
[66] Y.Zhao、E.Levina和J.Zhu,《社交网络社区抽取》,Proc。国家。阿卡德。科学。美国,108(2011),第7321-7326页。
[67] 赵彦,李维娜,朱军,度修正随机块模型下网络社区检测的一致性,Ann.Statist。,40(2012年),第2266-2292页·兹比尔1257.62095
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。