文件Zbl 1484.62073-zbMATH Open

使用光谱方法检测网络中的重叠社区。（英语） Zbl 1484.62073号

SIAM J.数学。数据科学。 2，第2号，265-283（2020）.

总结：社区检测在网络分析中已经得到了很好的研究，但更现实的重叠社区的情况仍然是一个挑战。在这里，我们提出了一个通用的、灵活的、可解释的重叠社区生成模型，它可以被视为以不同的方式概括了以前的几个模型。我们开发了一种有效的谱算法来估计社区成员，该算法通过使用（K）-中位数算法而不是通常的谱域聚类平均值来处理重叠。我们表明，当网络不太稀疏且社区之间的重叠不太大时，该算法是渐近一致的。在模拟网络和许多真实社交网络上的数值实验表明，与许多用于重叠社区检测的基准方法相比，我们的方法表现良好。

引用于13文件

MSC公司：

62H22个	概率图形模型
62H30型	分类和区分；聚类分析（统计方面）
2012年12月62日	参数估计量的渐近性质

关键词：

网络分析;社区检测;重叠簇

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

参考文献：

[1]	E.M.Airoldi、D.M.Blei、S.E.Fienberg和E.P.Xing，混合成员随机块模型，J.Mach。学习。Res.，9（2008），第1981-2014页·兹比尔1225.68143
[2]	A.A.Amini、A.Chen、P.J.Bickel和E.Levina，大型稀疏网络中社区检测的伪似然方法，Ann.Statist。，41（2013），第2097-2122页·Zbl 1277.62166号
[3]	A.Anandkumar、R.Ge、D.Hsu和S.M.Kakade，学习混合成员社区模型的张量方法，J.Machine Learn。Res.，15（2014），第2239-2312页·Zbl 1318.68136号
[4]	B.Ball、B.Karrer和M.E.J.Newman，一种有效且有原则的网络社区检测方法，Phys。E版，34（2011），036103。
[5]	P.J.Bickel和A.Chen，网络模型和Newman-Girvan及其他模块的非参数视图，Proc。国家。阿卡德。科学。美国，106（2009），第21068-21073页·Zbl 1359.62411号
[6]	P.J.Bickel和P.Sarkar，网络中自动社区检测的假设测试，J.R.Stat.Soc.Ser。B统计方法。，78（2016），第253-273页·Zbl 1411.62162号
[7]	H.Bolouri和E.H.Davidson，“群落效应”的基因调控网络基础，海胆胚胎实例分析，发育生物学。，340（2010），第170-178页。
[8]	蔡洪涛，李晓霞，存在任意离群节点的鲁棒和计算可行社区检测，Ann.Statist。，43（2015），第1027-1059页·Zbl 1328.62381号
[9]	B.L.Chamberlain，分布并行计算工作负载的图形分区算法，华盛顿大学技术报告UW-CSE-98-10，3，西雅图，华盛顿州，1998年。
[10]	K.Chaudhuri、F.C.Graham和A.Tsiatas，扩展种植分割模型中具有一般度的图的谱聚类，《第25届学习理论年会论文集》，苏格兰爱丁堡，2012，35。
[11]	K.Chen和J.Lei，确定网络数据中社区数量的网络交叉验证，J.Amer。统计师。协会，113（2018），第241-251页·Zbl 1398.62159号
[12]	陈寅，李晓霞，徐建军，度修正随机块模型的凸模块最大化，统计年鉴。，46（2018），第1573-1602页·Zbl 1410.62105号
[13]	D.S.Choi、P.J.Wolfe和E.M.Airoldi，类数量不断增加的随机块模型，Biometrika，99（2012），第273-284页·Zbl 1318.62207号
[14]	A.Decelle、F.Krzakala、C.Moore和L.Zdeborovaí，模块化网络随机块模型及其算法应用的渐近分析，Phys。E版，84（2011），066106。
[15]	S.Fortunato，《图形中的社区检测》，Phys。众议员，486（2010），第75-174页。
[16]	C.Gao，Z.Ma，A.Y.Zhang，H.H.Zhou，度校正块模型中的社区检测，Ann.Statist。，46（2018），第2153-2185页·Zbl 1408.62116号
[17]	N.Gillis和S.Vavasis，可分离非负矩阵分解的快速鲁棒递归算法，IEEE Trans。模式分析。机器。智力。，36（2014），第698-714页·Zbl 1316.15015号
[18]	A.Goldenberg、A.X.Zheng、S.E.Fienberg和E.M.Airoldi，《统计网络模型调查》，Found。趋势马赫数。学习。，2（2010年），第129-233页·Zbl 1184.68030号
[19]	S.Gregory，《通过标签传播发现网络中重叠的社区》，《新物理学杂志》。，12 (2010), 103018. ·Zbl 1448.90094号
[20]	B.Hendrickson和T.G.Kolda，并行计算的图形分区模型，并行计算。，26（2000），第1519-1534页·Zbl 0948.68130号
[21]	P.W.Holland、K.B.Laskey和S.Leinhardt，《随机区块模型：第一步》，社交网络，5（1983），第109-137页。
[22]	P.W.Holland和S.Leinhardt，有向图概率分布的指数族，J.Amer。统计师。协会，76（1981），第33-50页·Zbl 0457.62090号
[23]	A.Hollocou、T.Bonald和M.Lelarge，基于模块的稀疏软图聚类，AISTATS 2019，日本冲绳，2019。
[24]	S.B.Hopkins和D.Steurer，《少数样本的有效贝叶斯估计：社区检测和相关问题》，载于第58届IEEE计算机科学基础年度研讨会论文集，IEEE，华盛顿特区，2017，第379-390页。
[25]	J.Jin，通过分数快速社区检测，Ann.Statist。，43（2015），第57-89页·Zbl 1310.62076号
[26]	J.Jin和Z.T.Ke，混合成员估计的一个尖锐下限，预印本，https://arxiv.org/abs/1709.05603, 2017.
[27]	J.Jin、Z.T.Ke和S.Luo，通过单纯形顶点搜索估计网络成员，预印本，https://arxiv.org/abs/1708.07852, 2017.
[28]	A.Joseph和B.Yu，正则化对谱聚类的影响，Ann.Statist。，44（2016），第1765-1791页·Zbl 1357.62229号
[29]	B.Karrer和M.E.Newman，网络中的随机块模型和社区结构，物理。E版，83（2011），016107。
[30]	E.Kaufmann、T.Bonald和M.Lelarge，用于恢复网络中重叠社区的加性聚类谱算法，《算法学习理论国际会议论文集》，纽约斯普林格，2016年，第355-370页·Zbl 1398.68441号
[31]	A.Lancichinetti、S.Fortunato和J.Kerteász，《检测复杂网络中重叠和层级社区结构》，《新物理学杂志》。，11 (2009), 033015.
[32]	A.Lancichinetti、F.Radichi、J.J.Ramasco和S.Fortunato，《发现网络中具有统计意义的社区》，《公共科学图书馆·综合》，6（2011），e18961。
[33]	P.Latouche、E.Birmeleí和C.Ambroise，重叠随机块模型，预印本，https://arxiv.org/abs/0910.2098v1, 2009. ·Zbl 1349.62276号
[34]	C.M.Le和E.Levina，用谱方法估计网络中的社区数量，预印本，https://arxiv.org/abs/11507.00827, 2015.
[35]	C.M.Le、E.Levina和R.Vershynin，通过低阶近似优化网络中的社区检测，Ann.Statist。，44（2016），第373-400页·Zbl 1331.62312号
[36]	J.Leskovec和J.J.Mcauley，《学习发现自我网络中的社交圈》，摘自《神经信息处理系统进展》，内华达州塔霍湖，2012年，第539-547页。
[37]	T.Li、E.Levina和J.Zhu，边缘采样网络交叉验证，预印本，https://arxiv.org/abs/1612.04717, 2016. ·Zbl 1441.62049号
[38]	D.Lusseau、K.Schneider、O.J.Boisseau、P.Haase、E.Slooten和S.M.Dawson，声音可疑的宽吻海豚群落具有很大比例的长期联系，行为生态学。Sociobiol.公司。，54（2003），第396-405页。
[39]	X.Mao、P.Sarkar和D.Chakrabarti，估计具有尖锐特征向量偏差的混合成员，预印本，https://arxiv.org/abs/1709.00407, 2017.
[40]	X.Mao、P.Sarkar和D.Chakrabarti，《关于混合成员和对称非负矩阵因式分解》，第34届机器学习国际会议论文集，第70卷，JMLR，澳大利亚悉尼，2017年，第2324-2333页。
[41]	X.Mao、P.Sarkar和D.Chakrabarti，《重叠聚类模型和一类SVM将它们结合在一起》，《神经信息处理系统进展》，加拿大蒙特利尔，2018，第2126-2136页。
[42]	E.Mossel、J.Neeman和A.Sly，二元对称块模型的一致性阈值，预印本，https://arxiv.org/abs/1407.1591v1, 2014. ·Zbl 1321.05242号
[43]	M.E.Newman和M.Girvan，《发现和评估网络中的社区结构》，《物理学》。E版，69（2004），026113。
[44]	M.E.J.Newman，网络社区检测和图形划分的光谱方法，物理。E版，88（2013），042822。
[45]	T.L.J.Ng和T.B.Murphy，广义随机点积图，统计学家。普罗巴伯。莱特。，148（2019），第143-149页，https://doi.org/10.1016/j.spl.2019.01.011。 ·Zbl 1442.60017号
[46]	C.L.M.Nickel，《随机点积图：社交网络模型》，博士论文，约翰霍普金斯大学，马里兰州巴尔的摩，2007年。
[47]	G.Palla、I.Dereínyi、I.Farkas和T.Vicsek，《揭示自然界和社会中复杂网络的重叠社区结构》，《自然》，435（2005），第814-818页。
[48]	C.Pizzuti，复杂网络中的重叠社区检测，《第十一届遗传和进化计算年会论文集》，美国计算机学会，纽约，2009年，第859-866页。
[49]	I.Psorakis、S.Roberts、M.Ebden和B.Sheldon，使用贝叶斯非负矩阵分解的重叠社区检测，Phys。E版，83（2011），066114。
[50]	T.Qin和K.Rohe，度校正随机块模型下的正则谱聚类，《神经信息处理系统进展》，内华达州塔霍湖，2013年，第3120-3128页。
[51]	M.D.Resnick、P.S.Bearman、R.W.Blum、K.E.Bauman、K.M.Harris、J.Jones、J.Tabor、T.Beuhring、R.E.Sieveng和M.Shew，《保护青少年免受伤害：国家青少年健康纵向研究的发现》，JAMA，278（1997），第823-832页。
[52]	K.Rohe、S.Chatterjee和B.Yu，谱聚类和高维随机块模型，Ann.Statist。，39（2011），第1878-1915页·Zbl 1227.62042号
[53]	P.Rubin-Delhancy、C.E.Priebe和M.Tang，混合成员随机块模型邻接谱嵌入的一致性，预印本，https://arxiv.org/abs/1705.04518, 2017.
[54]	D.F.Saldana、Y.Yu和Y.Feng，有多少社区？，预印本，https://arxiv.org/abs/1412.1684, 2014.
[55]	P.Sarkar和P.J.Bickel，规范化在随机块模型光谱聚类中的作用，预印本，https://arxiv.org/abs/1310.1495, 2013. ·Zbl 1320.62150号
[56]	M.Tang和C.E.Priebe，随机图的归一化拉普拉斯特征向量的极限定理，Ann.Statist。，46（2018），第2360-2415页·兹比尔1408.62120
[57]	U.Von Luxburg，光谱聚类教程，统计计算。，17（2007），第395-416页。
[58]	F.Wang、T.Li、X.Wang、S.Zhu和C.Ding，使用非负矩阵因式分解的社区发现，Data Min.Knowl。发现。，22（2011），第493-521页·Zbl 1235.68034号
[59]	X.Wen，W.-N.Chen，Y.Lin，T.Gu，H.Zhang，Y.Li，Y.Yin，and J.Zhang.《基于最大团的重叠社区检测多目标进化算法》，IEEE Trans。进化。计算。，21（2016），第363-377页。
[60]	J.J.Whang、D.F.Gleich和I.S.Dhillon，使用邻居膨胀种子扩展进行重叠社区检测，IEEE Trans。知识。数据工程，28（2016），第1272-1284页。
[61]	J.Xie、S.Kelley和B.K.Szymanski，《网络中的重叠社区检测：最先进和比较研究》，ACM Compute。调查，45（2013），43·Zbl 1288.68191号
[62]	S.J.Young和E.R.Scheinerman，《社交网络的随机点积图模型》，收录于《网络图的算法和模型》，施普林格，纽约，2007年，第138-149页·Zbl 1136.05322号
[63]	W.W.Zachary，《小群体冲突和分裂的信息流模型》，J.人类学。研究，33（1977），第452-473页。
[64]	A.Zhang，《蛋白质相互作用网络：计算分析》，剑桥大学出版社，英国剑桥，2009年·Zbl 1320.92021
[65]	张亚勇，周海宏，随机区组模型中社区检测的最小极大率，Ann.Statist。，44（2016），第2252-2280页·Zbl 1355.60125号
[66]	Y.Zhao、E.Levina和J.Zhu，《社交网络社区抽取》，Proc。国家。阿卡德。科学。美国，108（2011），第7321-7326页。
[67]	赵彦，李维娜，朱军，度修正随机块模型下网络社区检测的一致性，Ann.Statist。，40（2012年），第2266-2292页·兹比尔1257.62095

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b：book；一：图书文章）

一&b	逻辑和
一\|b	逻辑或
!ab公司	逻辑非
作业成本法*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

使用光谱方法检测网络中的重叠社区。（英语） Zbl 1484.62073号

MSC公司：

关键词：

参考文献：

示例

领域

操作员

使用光谱方法检测网络中的重叠社区。 （英语） Zbl 1484.62073号

MSC公司：

关键词：

参考文献：

使用光谱方法检测网络中的重叠社区。（英语） Zbl 1484.62073号