×

社区稳健性验证。 (英语) Zbl 1469.62029号

概述:社区检测及其应用方面的大量工作留下了一个重要的问题:结果的统计验证。提出了一种方法,该方法能够清楚地检测某些算法发现的社区结构是否具有统计学意义,或者仅仅由于网络中的边缘位置而是偶然的结果。给定社区检测方法和感兴趣的网络,该建议检验了针对原始图结构的随机扰动恢复的分区的稳定性。为了解决这个问题,指定了一个扰动策略和一个空模型图,它在某些结构属性上与原始图相匹配,但在其他方面是一个随机图。使用为功能数据分析设置的工具,基于一种特殊的聚类距离度量,即信息变化,构建了一组过程。该过程确定所获得的聚类是否显著偏离零模型。这有力地支持了用于识别社区结构的算法对扰动的鲁棒性。文中给出并讨论了使用该技术在模拟和实际数据集上获得的结果。

MSC公司:

62-08 统计问题的计算方法
62H22个 概率图形模型
62J15型 成对和多次比较;多次测试
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bender,E.A。;Canfield,E.R.,具有给定度序列的标记图的渐近数,J.Combin。理论A,24,296-307,(1978),MR0505796·Zbl 0402.05042号
[2] Y.本杰米尼。;Hochberg,Y.,《控制错误发现率:多假设检验的实用有效方法》,J.R.Stat.Soc.Ser。B统计方法。,57, 289-300, (1995) ·Zbl 0809.62014号
[3] Bianconi,G。;销,P。;Marsili,M.,《评估节点特征与网络结构的相关性》,Proc。国家。阿卡德。科学。,10611433(2009年)
[4] 布隆德尔,A.V。;纪尧姆,J.L。;兰比奥特,R。;Lefebvre,E.,《大型网络中社区的快速发展》,J.Stat.Mech。,P10008,(2008)·兹比尔1459.91130
[5] 克劳塞特,A。;纽曼,M.E.J。;Moore,C.,《在非常大的网络中发现社区结构》,Phys。版本E,70,066111,(2004)
[6] Coscia,M。;Giannotti,F。;Pedreschi,D.,《复杂网络中社区发现方法的分类》,《统计分析》。Data Min.,4512-546,(2011),MR2842407·Zbl 07260300号
[7] Cutillo,L。;卡里西莫,A。;Figini,S.,《网络选择:排名列表选择方法》,《公共科学图书馆·综合》,第7、8、e43678页,(2012年)
[8] 达农,L。;Guilera,医学博士。;杜赫,J。;Arenas,A.,《社区结构识别比较》,J.Stat.Mech.:理论实验,2005,(2005)
[9] 德·维科·法拉尼,F。;尼科西亚,V。;拉托拉,V。;Chavez,M.,光谱网络聚类随机漫步的非参数重采样,Phys。版本E,89,012802,(2014)
[10] Fortunato,S.,《图形中的社区检测》,Phys。众议员,486,75-174,(2010)
[11] 凝胶,Y.R。;吕布奇奇,V。;Ramirez-Ramirez,L.L.,网络度分布中估计不确定性的Bootstrap量化,科学。代表,75807(2017)
[12] 格菲勒,D。;Chappelier,J.C。;De Los Rios,P.,《发现复杂网络社区结构中的不稳定性》,Phys。E版,72,056135,(2005)
[13] Gkantsidis,C。;米哈伊尔,M。;Zegura,E.,生成连通幂律随机图的马尔可夫链模拟方法,(算法工程与实验第五次研讨会论文集,(2003),SIAM),16-25
[14] Goldenberg,A。;郑,A.X。;SE Fienberg,S.E。;Airoldi,E.M.,《统计网络模型调查》,Found。趋势马赫数。学习。,2, 129-233, (2010) ·Zbl 1184.68030号
[15] 吉梅拉,R。;Sales-Pardo,M。;Amaral,L.A.N.,《随机图和复杂网络波动的模块化》,《物理学》。版本E,70,025101,(2004)
[16] Hakimi,S.L.,关于整数集作为线性图顶点度数的可实现性。一、 J.Soc.Ind.申请。数学。,10, 3, 496-506, (1962) ·Zbl 0109.16501号
[17] Harenberg,S。;贝洛,G。;Gjeltema,L。;Ranshous,S。;哈拉尔卡,J。;西伊·R。;Padmanabhan,K。;Samatova,N.,《大规模网络中的社区检测:调查和实证评估》,WIREs Compute。统计,6426-439,(2014)
[18] Havel,V.,关于有限图存在性的注记,Cas。害虫。材料,80477-480,(1955)·Zbl 0068.37202号
[19] Jeong,H。;梅森,S.P。;巴拉巴西,A.-L。;Oltvai,Z.N.,蛋白质网络中的致死性和中心性,《自然》,411,41-42,(2001)
[20] Kalaitzis,A.A。;劳伦斯,N.D.,《通过高斯过程回归对差异表达基因表达时间进程进行排序的简单方法》,BMC生物信息学,12,180,(2011)
[21] 卡勒,B。;莱维纳,E。;Newman,M.E.J.,《网络中社区结构的稳健性》,Phys。E版,77,046119,(2008)
[22] 布莱恩·卡勒(Brian Karrer);Newman,M.E.J.,《网络中的随机块模型和社区结构》,Phys。版本E,83,1,016107,(2011)
[23] Kolacyzk,E.D.,《网络模型的统计分析》(2009),纽约斯普林格出版社·Zbl 1277.62021号
[24] Lancichinetti,A。;Radichi,F。;Ramasco,J.J.,《网络中社区的统计意义》,《物理学》。版本E,81,046110,(2010)
[25] Lancichinetti,A。;Radichi,F。;Ramasco,J.J。;Fortunato,S.,《在网络中寻找具有统计意义的社区》,PLoS One,6,4,e18961,(2011)
[26] Massen,C.P.,Doye,J.P.K.,2006年。群落结构热力学。arXiv:cond-mat/0610077v1;Massen,C.P.,Doye,J.P.K.,2006年。群落结构热力学。arXiv:cond-mat/0610077v1
[27] McAuley,J.、Leskovec,J.,2012年。学习发现自我网络中的社交圈。NIPS。第548-556页。;McAuley,J.、Leskovec,J.,2012年。学习发现自我网络中的社交圈。NIPS。第548-556页。
[28] 梅勒,M.,《比较聚类与基于信息的距离》,《多元分析杂志》。,98, 873-895, (2007) ·Zbl 1298.91124号
[29] Newman,M.E.J.,《复杂网络的结构和功能》,SIAM Rev.,45,2,167-256,(2003)·兹比尔1029.68010
[30] 纽曼,M.E.J。;Girvan,M.,《发现和评估网络中的社区结构》,Phys。修订版E,69026113,(2004年)
[31] Orsini,C.,《将真实网络中的随机性量化》,美国国家通讯社。,6, 8627, (2015)
[32] 佩沙林,F。;Salmaso,L.,《复杂数据的置换测试:理论、应用和软件》,(2010年),John Wiley&Sons Inc.Chichester
[33] Petit,A.N.,两样本Anderson darling秩统计,生物计量学,63161-168,(1976)·Zbl 0328.62028号
[34] Pini,A。;Vantini,S.,《区间测试程序:功能数据分析中推断的一般框架》,生物计量学,(2016)·Zbl 1390.62298号
[35] 波曼,G.-M。;A.-M.施泰克。;Ghosh,S.,《应用于多发性硬化扩散张量成像研究的功能数据的双样本无分布测试》,J.Roy。统计师。Soc.:序列号。C、 65395-414(2016)
[36] 波特,医学硕士。;Onnela,J.-P。;Mucha,P.J.,《网络社区》,《美国通告》。数学。Soc.,56,1082-1097,(2009),MR2568495·Zbl 1188.05142号
[37] J.O.拉姆齐。;Silverman,B.W.,(功能数据分析,统计中的Springer系列,1997年),(印刷版)978-1-4757-7107-7(在线)·Zbl 0882.6202号
[38] J.O.拉姆齐。;Silverman,B.W.,(应用功能数据分析:方法和案例研究,统计学中的Springer系列,(2002)),(在线)-978-0-3879-5414-1·Zbl 1011.62002号
[39] 拉斯穆森,C.E。;Williams,C.K.I.,机器学习的高斯过程,(2006),麻省理工学院出版社·Zbl 1177.68165号
[40] Reichardt,J。;Bornholdt,S.,具有任意度分布的图的划分和模块化,Phys。E版,76015102,(2007)
[41] 罗斯瓦尔,M。;Bergstrom,C.,《绘制大型网络中的变化》,《公共科学图书馆·综合》,5,1,e8694,(2010)
[42] Sah,P。;路易斯安那州辛格。;克劳塞特,A。;Bansal,S.,用随机图探索生物网络中的社区结构,BMC生物信息学,15,220,(2014)
[43] 冯·梅林,C。;克劳斯,R。;斯内尔,B。;康奈尔,M。;奥利弗·S·G。;菲尔兹,S。;Bork,P.,蛋白质相互作用大规模数据集的比较评估,《自然》,417399-403,(2002)
[44] Wade,S.,Ghahrmani,Z.,2015年。贝叶斯聚类分析:点估计和可信球。arXiv:1505.03339;Wade,S.,Ghahrmani,Z.,2015年。贝叶斯聚类分析:点估计和可信球。arXiv公司:1505.03339
[45] Watts,D.J。;Strogatz,S.H.,“小世界”网络的集体动态,《自然》,393,440-442,(1998)·Zbl 1368.05139号
[46] Wilson,J.D。;王,S。;穆查,P.J。;巴米迪,S。;Nobel,A.B.,一种用于识别网络中重要社区的基于测试的提取算法,Ann.Appl。统计,8,3,1853-1891,(2014),MR3271356·Zbl 1304.05141号
[47] 杨,Z。;阿尔盖谢默,R。;Tessone,C.J.,《人工网络上社区检测算法的比较分析》,美国国家通讯社。,6, 30750, (2016)
[48] Zweig,K.A.,《网络分析素养——网络分析的实用方法》,(2016年),施普林格-弗拉格-维恩出版社
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。