×

网络总体的假设检验。 (英语) Zbl 07706262号

摘要:收集以网络为基本数据对象的多个网络数据样本已成为现代科学和工程中越来越普遍的做法。随着多重网络数据的日益普及,需要开发能够处理网络群体推理问题的模型和理论。在这项工作中,我们提出了一个网络假设检验的一般程序,特别是区分两个网络样本的分布。我们考虑一个非常通用的框架,它允许我们在大型和稀疏网络上执行测试。我们的贡献是双重的:(1)提出了一种基于广义Wigner矩阵奇异值的测试统计量。当节点数趋于无穷大时,统计的渐近零分布遵循Tracy-Widom分布。该测试还产生了渐近功率保证,在备选方案下功率趋于1;(2) 该测试程序适用于动态网络中的变化点检测,这被证明在检测变化点时是一致的。除了理论上的保证外,这种改进程序的另一个吸引人的特点是,它为选择阈值提供了一种原则性的简单方法,阈值也可以随时间变化。大量的模拟研究和实际数据分析证明了我们的程序在竞争对手中的卓越性能。

MSC公司:

62至XX 统计

软件:

测试BMN
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿米尼,A.A。;Levina,E.,关于块模型的半定松弛,《统计年鉴》,46,1,149-79(2018)·Zbl 1393.62021号 ·doi:10.1214/17-AOS1545
[2] 球,B。;卡勒,B。;Newman,M.E.J.,《探测网络中社区的高效原则方法》,《物理评论》。E、 统计、非线性和软物质物理学,84,3-2,036103(2011)·doi:10.1103/PhysRevE.84.036103
[3] 巴塞特,D.S。;E.布尔摩尔。;Verchinski,文学学士。;马泰,V.S。;温伯格,D.R。;Meyer-Lindenberg,A.,《健康与精神分裂症中人类皮层网络的层次结构》,《神经科学杂志》,28,37,9239-48(2008)·doi:10.1523/JNEUROSCI.1929-08.2008
[4] 巴塔查里亚,R。;Lin,L.,非欧空间上Fréchet均值和非参数推断的综合CLT,美国数学学会学报,145,413-28(2017)·Zbl 1353.60019号
[5] 比克尔,P.J。;Chen,A.,网络模型和Newman-Girvan及其他模块的非参数观点,美国国家科学院院刊,106,50,21068-73(2009)·Zbl 1359.62411号 ·doi:10.1073/pnas.0907096106
[6] 布诺瓦,G。;de Weck,O.,《异构图系综上多度量拓扑分析的度量及其相关模式概述》,《物理评论》。E、 统计、非线性和软物质物理学,85,1-2,016117(2012)·doi:10.103/物理版本E.85.016117
[7] 博伊森,L。;Kempe,A。;Liebscher,V。;Munk,A。;Wittich,O.,跳跃型最小二乘估计量的一致性和收敛速度,《统计年鉴》,37,1,157-83(2009)·Zbl 1155.62034号 ·doi:10.1214/07-AOS558
[8] 蔡,T。;李,H。;马,J。;Xia,Y.,微分马尔可夫随机场分析及其在检测差异微生物群落网络中的应用,Biometrika,106,2,401-16(2019)·Zbl 1444.62121号 ·doi:10.1093/biomet/asz012
[9] 陈,A。;曹,J。;Bu,T.,《网络层析成像:可识别性和傅里叶域估计》,IEEE信号处理学报,58,12,6029-39(2010)·Zbl 1392.94136号 ·doi:10.1109/TSP.2010.2068294
[10] 陈,H。;Zhang,N.,基于图形的变化点检测,《统计年鉴》,43,1,139-76(2015)·Zbl 1308.62090号 ·doi:10.1214/14-AOS1269
[11] 陈,J。;Yuan,B.,《检测酵母蛋白-蛋白质相互作用网络中的功能模块》,生物信息学(英国牛津),22,18,2283-90(2006)·doi:10.1093/bioinformatics/btl370
[12] 克莱恩,M.S。;斯穆特,M。;Cerami,E。;库欣斯基,A。;兰迪斯,北。;沃克曼,C。;圣诞,R。;阿维拉·卡皮罗,I。;克里奇,M。;Gross,B.,《利用细胞景观整合生物网络和基因表达数据》,《自然协议》,第2、10、2366-82页(2007年)·doi:10.1038/nprot.2007.324
[13] Decelle,A。;Krzakala,F。;摩尔,C。;Zdeborová,L.,模块化网络随机块模型及其算法应用的渐近分析,《物理评论》。E、 统计、非线性和软物质物理学,84,6-2,066106(2011)·doi:10.1103/PhysRevE.84.066106
[14] 杜兰特,D。;邓森,D.B。;Vogelstein,J.T.,网络总体的非参数Bayes建模,美国统计协会杂志,1125201516-30(2017)·doi:10.1080/01621459.2016年12月19260日
[15] Eagle,N。;Pentland,A.S。;Lazer,D.,《利用手机数据推断友谊网络结构》,美国国家科学院学报,106,36,15274-8(2009)·doi:10.1073/pnas.0900282106
[16] Erdős,P。;Rényi,A.,关于随机图。一、 数学出版物,6290-7(1959)·Zbl 0092.15705号
[17] Fréchet,M.,Leséléments aléatoires de nature quelconque dans un espace distancié,《亨利·庞加莱学院年鉴》,10,4,215-310(1948)·Zbl 0035.20802号
[18] Ghoshdastidar,D。;von Luxburg,U.,《神经信息处理系统的进展,图形双样本测试的实用方法》,3019-28(2018)
[19] Ghoshdastidar,D。;Gutzeit,M。;Carpentier,A。;Von Luxburg,U.,非均匀随机图的双样本假设检验,《统计年鉴》,48,4,2208-29(2020)·Zbl 1456.62108号 ·doi:10.1214/19-AOS1884
[20] 吉内斯特,C.E。;李,J。;巴拉昌德兰,P。;罗森博格,S。;Kolaczyk,E.D.,功能神经成像中网络数据的假设检验,应用统计年鉴,11,2,725-50(2017)·Zbl 1391.62217号 ·doi:10.1214/16-AOAS1015
[21] 霍夫,P.D。;Raftery,A.E。;Handcock,M.S.,社会网络分析的潜在空间方法,《美国统计协会杂志》,974601090-8(2002)·Zbl 1041.62098号 ·doi:10.1198/016214502388618906
[22] 荷兰,P.W。;Laskey,K.B。;Leinhardt,S.,《随机块模型:第一步》,《社交网络》,5,2,109-37(1983)·doi:10.1016/0378-8733(83)90021-7
[23] Josephs,N.、Lin,L.、Rosenberg,S.和Kolaczyk,E.D.,2020年。使用网络输入进行贝叶斯分类、异常检测和生存分析,并应用于微生物组。arXiv预印arXiv:2004.04765·Zbl 07656973号
[24] 卡勒,B。;Newman,M.E.J.,网络中的随机块模型和社区结构,物理评论E,83,1-2,016107(2011)·doi:10.1103/PhysRevE.83.016107
[25] Kolaczyk,E。;林,L。;罗森博格,S。;沃尔特斯,J。;Xu,J.,《未标记网络的平均值:几何特征和渐近行为》,《统计学年鉴》,48,1,514-38(2020)·兹比尔1439.62068
[26] Kossinets,G。;Watts,D.J.,《不断演变的社会网络的实证分析》,《科学》(纽约),311,5757,88-90(2006)·Zbl 1226.91055号 ·doi:10.1126/科学.1116869
[27] 库利格,A。;南卡罗来纳州。;Kwapien,J。;O shi wiȩcimka,P.,《模拟单词相邻网络增长中的平均最短路径长度》,《物理评论》E,91,3,032810(2015)·doi:10.1103/PhysRevE.91.032810
[28] Lei,J.,随机块模型的有效性检验,《统计年鉴》,44,1,401-24(2016)·Zbl 1331.62283号 ·doi:10.1214/15-AOS1370
[29] 莱昂纳迪,N。;Van De Ville,D.,多层图上的紧小波框架,IEEE信号处理汇刊,61,13,3357-67(2013)·Zbl 1393.94977号 ·doi:10.1109/TSP.2013.2259825
[30] Lovász,L.,《大型网络和图极限》(2012),普罗维登斯,RI:美国数学学会,普罗维登斯,RI·Zbl 1292.05001号
[31] 穆克吉,S.S。;Sarkar,P。;Lin,L.,神经信息处理系统的进展,关于聚类网络值数据,7071-81(2017)
[32] Niu,Y.S。;Zhang,H.,检测DNA拷贝数变化的筛选和排序算法,《应用统计年鉴》,6,3,1306-26(2012)·Zbl 1401.92145号 ·doi:10.1214/12-AOAS539
[33] Relión,法学博士。;凯斯勒,D。;莱维纳,E。;Taylor,S.F.,《网络分类与大脑连接组学的应用》,《应用统计年鉴》,第13、3、1648-77页(2019年)·Zbl 1433.62314号
[34] Rohe,K。;Chatterjee,S。;Yu,B.,谱聚类和高维随机块模型,《统计年鉴》,39,4,1878-915(2011)·Zbl 1227.62042号 ·doi:10.1214/11-AOS887
[35] Snijders,T.A.B。;Baerveldt,C.,《犯罪行为对友谊演变影响的多层次网络研究》,《数学社会学杂志》,27,2-3,123-51(2003)·Zbl 1059.91081号 ·doi:10.1080/00222500305892
[36] 唐,M。;Athreya,A。;苏斯曼,D.L。;利津斯基,V。;纽约州帕克市。;Priebe,C.E.,随机图的半参数双样本假设检验问题,计算与图形统计杂志,26,2,344-54(2017)·doi:10.1080/10618600.2016.1193505
[37] 特蕾西,C.A。;Widom,H.,《正交和辛矩阵系综》,《数学物理中的通信》,177,3727-54(1996)·Zbl 0851.60101号 ·doi:10.1007/BF02099545
[38] von Luxburg,U.,《光谱聚类、统计和计算教程》,17,4,395-416(2007)·数字对象标识代码:10.1007/s11222-007-9033-z
[39] Wolfe,P.J.和Olhede,S.C.,2013年。非参数graphon估计。arXiv:1309.5936。
[40] 张,B。;李,H。;Riggins,R.B。;詹,M。;Xuan,J。;张,Z。;霍夫曼,E.P。;克拉克,R。;Wang,Y.,《识别生物网络中条件特定拓扑变化的差异依赖网络分析》,生物信息学(英国牛津),25,4,526-32(2009)·doi:10.1093/bioinformatics/btn660
[41] Zhang,Y。;莱维纳,E。;Zhu,J.,通过邻域平滑估计网络边缘概率,Biometrika,104,4,771-83(2017)·Zbl 07072327号 ·doi:10.1093/biomet/asx042
[42] Zhao,Chen,L.和Lin,L.2019年。动态网络中基于graphon估计的变点检测。arXiv:1908.01823年。
[43] 邹,C。;尹,G。;冯·L。;Wang,Z.,多个变点问题的非参数最大似然方法,《统计学年鉴》,42,3970-1002(2014)·Zbl 1305.62158号 ·doi:10.1214/14-AOS1210
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。