×

用光谱法估算群落数量。 (英语) Zbl 1493.62313号

摘要:社区检测是网络分析中的一个基本问题,有许多方法可用于估计社区。大多数这些方法都假设社区的数量是已知的,但实际情况往往并非如此。我们研究了一种基于某些图算子(如非回溯矩阵和Bethe-Hessian矩阵)的谱特性估计社区数量的简单快速方法,并且保证在几个渐近状态下是一致的。我们将该方法与几种现有的估算社区数量的方法进行了比较,结果表明该方法更准确,计算效率更高。

MSC公司:

62小时12分 多元分析中的估计
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] E.阿贝。社区检测和随机块模型:最新发展。机器学习研究杂志, 18:1-86, 2018. ·Zbl 1403.62110号
[2] L.A.Adamic和N.Glance。政治博客圈和2004年美国大选。WWW-2005网络日志生态系统研讨会论文集, 2005.
[3] E.M.Airoldi、D.M.Blei、S.E.Fienberg和E.P.Xing。混合成员随机块模型。J.机器学习研究, 9:1981-2014, 2008. ·兹比尔1225.68143
[4] A.A.Amini、A.Chen、P.J.Bickel和E.Levina。大型稀疏网络中社区检测的伪似然方法。统计年鉴, 41(4):2097-2122, 2013. ·Zbl 1277.62166号
[5] O.Angel、J.Friedman和S.Hoory。图的通用覆盖的非回溯谱。美国数学学会会刊, 367(6):4287-4318, 2015. ·Zbl 1310.05136号
[6] H.低音。树格的Ihara-Selberg zeta函数。国际数学杂志, 3(06):717-797, 1992. ·Zbl 0767.11025号
[7] F.Benaych-Georges、C.Bordenave和A.Knowles。稀疏随机矩阵的谱半径。Ann.Inst.H.PoincaréProbab公司。统计师。, 56(3):2141-2161, 2020. ·Zbl 1459.15036号
[8] R.巴蒂亚。矩阵分析纽约施普林格-弗拉格出版社,1996年·Zbl 0863.15001号
[9] P.Bickel和P.Sarkar。网络中自动社区检测的假设测试。英国皇家统计学会杂志:B辑,即将出版, 2013. ·Zbl 1411.62162号
[10] P.J.Bickel和A.Chen。网络模型和Newman-Girvan及其他模块的非参数视图。程序。国家。阿卡德。科学。美国, 106:21068-21073, 2009. ·Zbl 1359.62411号
[11] C.博尔德纳夫、M.勒拉赫和L.马苏莱。随机图的非回溯谱:社区检测和非正则Ramanujan图。概率年鉴, 46(1):1-71, 2018. ·Zbl 1386.05174号
[12] K.Chaudhuri、F.Chung和A.Tsiatas。扩展种植分割模型中一般度图的谱聚类。机器学习研究研讨会和会议记录杂志, 23:35.1-35.23, 2012.
[13] K.Chen和J.Lei。用于确定网络数据中社区数量的网络交叉验证。美国统计协会杂志, 113(521):241-251, 2018. ·Zbl 1398.62159号
[14] J.Daudin、F.Picard和S.Robin。随机图的混合模型。统计师。计算。, 18:173-183, 2008.
[15] M.Girvan和M.E.J.Newman。社会和生物网络中的社区结构。程序。国家。阿卡德。科学。, 99(12):7821-7826, 2002. ·Zbl 1032.91716号
[16] 桥本。有限图的Zeta函数和p-adic群的表示。纯数学高级研究, 15:211-280, 1989. ·Zbl 0709.22005
[17] P.W.Holland、K.B.Laskey和S.Leinhardt。随机块模型:第一步。社交网络, 5(2):109-137, 1983.
[18] J.Hu、H.Qin、T.Yan和Y.Zhao。修正了随机块模型的贝叶斯信息准则。将在美国统计协会杂志上发表, 2019. ·Zbl 1452.62154号
[19] B.Karrer和M.E.J.Newman。网络中的随机块模型和社区结构。物理审查E, 83:016107, 2011.
[20] F.Krzakala、C.Moore、E.Mossel、J.Neeman、A.Sly、L.Zdeborová和P.Zhang。聚类稀疏网络中的谱赎回。程序。国家。阿卡德。科学。, 110(52):20935-20940, 2013. ·Zbl 1359.62252号
[21] P.Latouche、E.Birmelé和C.Ambroise。随机块模型的变分贝叶斯推理和复杂性控制。统计建模, 12:93-115, 2012. ·Zbl 1420.62114号
[22] C.M.Le、E.Levina和R.Vershynin。随机图的集中和正则化。随机结构与算法, 2017. ·Zbl 1373.05179号
[23] J.Lei。随机块模型的良好性检验。统计年鉴, 44(1):401-424, 2016. ·Zbl 1331.62283号
[24] T.Li、E.Levina和J.Zhu。通过边缘采样进行网络交叉验证。生物特征, 107(2):257-276, 2020. ·Zbl 1441.62049号
[25] D.Lusseau、K.Schneider、O.J.Boisseau、P.Haase、E.Slooten和S.M.Dawson。声音可疑的宽吻海豚群落具有长期联系的大量比例。地理隔离能解释这种独特的特征吗?行为生态学和社会生物学, 54:396-405, 2003.
[26] S.Ma、L.Su和Y.Zhang。确定度校正随机块模型中的社区数。arXiv:1809.01028, 2018. ·Zbl 07370586号
[27] L.Massoulié。社区检测阈值和弱ramanujan属性。第四十六届ACM计算理论年会论文集,STOC’14,第694-703页。ACM,2014年·Zbl 1315.68210号
[28] 麦克谢里。随机图的谱划分。程序。第42届FOCS,第529-537页,2001年。
[29] E.Mossel、J.Neeman和A.Sly。随机块模型和重建。arXiv:1202.14992012年·兹比尔1350.05154
[30] E.Mossel、J.Neeman和A.Sly。种植分区模型中的重建和估计。概率论及其相关领域,DOI:10.1007/s00440-014-0576-6,2014年·Zbl 1320.05113号
[31] E.Mossel、J.Neeman和A.Sly。块模型阈值猜想的证明。组合数学, 38(3):665-708, 2018. ·Zbl 1424.05272号
[32] M.E.J.纽曼。使用矩阵的特征向量发现网络中的社区结构。物理审查E, 74(3):036104, 2006.
[33] M.E.J.纽曼。网络中的模块化和社区结构。程序。国家。阿卡德。科学。美国, 103(23):8577-8582, 2006.
[34] M.E.J.Newman和M.Girvan。发现和评估网络中的社区结构。物理审查E, 69(2):026113, 2004.
[35] T.P.佩克索托。大型网络中的节俭模块推理。物理学。修订稿。, 110:148701, 2013.
[36] M.A.Riolo、G.T.Cantwell、G.Reinert和M.E.J.Newman。用于估计网络中社区数量的有效方法。物理复习E, 96:032310, 2017.
[37] K.Rohe、S.Chatterjee和B.Yu。谱聚类和高维随机块模型。统计年刊, 39(4):1878-1915, 2011. ·Zbl 1227.62042号
[38] A.Saade、F.Krzakala和L.Zdeborová。图的谱聚类与Bethe Hessian。神经信息处理系统的进展27,第406-414页,2014年。
[39] D.F.Saldana、Y.Yu和Y.Feng。有多少个社区?计算与图形统计杂志, 26(1):171-181, 2017.
[40] T.Tao和V.Vu。随机矩阵:esds的普适性和循环定律。安·普罗巴伯。, 38(5):2023-2065, 2010. ·Zbl 1203.15025号
[41] 随机离散矩阵。组合数学的视界,第257-280页,2008年·Zbl 1154.15024号
[42] 一种用于查找隐藏分区的简单SVD算法。组合数学、概率论和计算, 27(1):124-140, 2018. ·Zbl 1386.68110号
[43] K.Wang和P.M.Wood。Erdos-Renyi随机图非回溯矩阵的极限经验谱分布。arXiv:1710.11015, 2017.
[44] R.Wang和P.Bickel。随机块模型的基于似然的模型选择。安。统计师。, 45(2):500-528, 2017. ·Zbl 1371.62017年
[45] B.Yan、P.Sarkar和X.Cheng。区块模型中区块数量的可证明估计。机器学习研究进展, 84:1185-1194, 2018.
[46] W.W.Zachary。小群体冲突和分裂的信息流模型。人类学研究杂志, 33:452-473, 1977.
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。