×

一种用于网络群体中假设测试的基于频谱的框架。 (英语) Zbl 07796622号

摘要:我们提出了一种新的基于光谱的网络总体假设检验方法。主要目标是开发一种测试,以确定两个给定的网络样本是否来自相同的随机模型或分布。我们的测试统计基于居中且缩放的邻接矩阵到三次方的迹,我们证明了当节点数趋于无穷大时,该邻接矩阵收敛于标准正态分布。我们还提供了测试的渐近幂保证。在描述所提出的测试统计量的理论属性时,我们探讨了网络数量和每个网络中节点数量之间的关系。我们的测试可以应用于二进制和加权网络,在一个非常通用的框架下运行,在该框架中,网络可以是大型和稀疏的,并且可以扩展到多样本测试。我们提出了一项模拟研究,证明了我们的测试优于现有方法的性能,并将我们的测试应用于三个实际数据集。

理学硕士:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Arroyo Relión,J.D.、Kessler,D.、Levina,E.和Taylor,S.F.(2019年)。网络分类及其在脑连接组学中的应用。《应用统计年鉴》第13期,1648-1677年·Zbl 1433.62314号
[2] Bai,Z.和Silverstein,J.W.(2010年)。大维随机矩阵的谱分析。纽约州施普林格;伦敦·Zbl 1301.60002号
[3] Banerjee,D.和Ma,Z.(2017年)。具有增长度的随机块模型的最优假设检验。arXiv:1705.05305。
[4] Bernstein,S.(1946)。概率论。莫斯科Gastehizdat出版社。
[5] Bhattacharya,B.B.、Das,S.和Mukherjee,S.(2020)。通过子图抽样进行主题估计:四阶矩现象。arXiv:2011.03026。
[6] Bickel,P.J.和Sarkar,P.(2016)。网络中自动社区检测的假设测试。英国皇家统计学会杂志:B辑(统计方法)78,253-273·Zbl 1411.62162号
[7] Cai,T.T.,Liu,W.和Xia,Y.(2014)。依赖性高维平均值的两个样本测试。英国皇家统计学会杂志。B系列(统计方法)76,349-372·Zbl 07555454号
[8] Chen,L.,Lin,L.和Zhou,J.(2020年)。用于功能神经成像数据的大型加权网络的假设检验。IEEE接入81815-191825。
[9] Chen,L.,Zhou,J.和Lin,L.(2021)。网络总体的假设检验。统计学中的传播——理论与方法52,3661-3684·Zbl 07706262号
[10] Chen,S.X.和Qin,Y.-L.(2010)。高维数据的双样本测试及其在基因测试中的应用。《统计年鉴》38,808-835·Zbl 1183.62095号
[11] Dong,Z.、Wang,S.和Liu,Q.(2020年)。复杂网络中社区检测的基于谱的假设检验。信息科学5121360-1371·Zbl 1457.91305号
[12] Eldridge,J.、Belkin,M.和Wang,Y.(2016)。图形、合并等等!神经信息处理系统的进展29。
[13] Ferrari,A.(2019年)。关于相关双平方变量和差的注记。arXiv:1906.09982。
[14] Gao,C.和Lafferty,J.(2017)。使用小子图统计测试全局网络结构。arXiv:1710.00862。
[15] Garrison,K.A.、Scheinost,D.、Finn,E.S.、Shen,X.和Constable,R.T.(2015)。功能性脑网络的稳定性跨阈值衡量。NeuroImage神经影像118,651-661。
[16] Ghoshdastidar,D.、Gutzeit,M.、Carpentier,A.和Luxburg,U.V.(2020年)。非均匀随机图的二样本次滞后检验。《统计年鉴》482208-2229·Zbl 1456.62108号
[17] Ghoshdastidar,D.和von Luxburg,U.(2018年)。图形双样本测试的实用方法。arXiv:1811.12752。
[18] Ginestet,C.E.、Fournel,A.P.和Simmons,A.(2014)。功能性MRI的统计网络分析:总结网络和组比较。计算神经科学前沿8。
[19] Ginestet,C.E.、Li,J.、Balachandran,P.、Rosenberg,S.和Kolaczyk,E.D.(2017年)。功能神经成像中网络数据的假设检验。应用统计年鉴11725-750·Zbl 1391.62217号
[20] Jin,J.、Ke,Z.T.和Luo,S.(2021)。签名多边形统计对网络测试的最佳适应性49,3408-3433·Zbl 1486.62168号
[21] Josephs,N.、Lin,L.、Rosenberg,S.和Kolaczyk,E.D.(2020年)。使用网络输入进行贝叶斯分类、异常检测和生存分析,并应用于微生物组。arXiv:2004.04765。
[22] Kolaczyk,E.D.、Lin,L.、Rosenberg,S.、Walters,J.和Xu,J.(2020年)。未标记网络的平均值:几何特征和渐近行为。《统计年鉴》48,514-538·Zbl 1439.62068号
[23] Layeghifard,M.、Hwang,D.M.和Guttman,D.S.(2017年)。解开微生物组中的相互作用:网络视角。《微生物学趋势》25,217-228。
[24] Lovász,L.(2012)。大型网络和图形限制。美国数学学会,普罗维登斯·Zbl 1292.05001号
[25] Mitchell,T.M.、Hutchinson,R.、Just,M.A.、Niculescu,R.S.、Pereira,F.和Wang,X.(2003)。从fMRI数据中对瞬时认知状态进行分类。AMIA年度研讨会论文集,465-469。
[26] Mitchell,T.M.、Hutchinson,R.、Niculescu,R.S.、Pereira,F.、Wang,X.、Just,M.等人(2004)。学习从大脑图像中解码认知状态。机器学习57,145-175·Zbl 1078.68715号
[27] Mukherjee,S.S.、Sarkar,P.和Lin,L.(2017年)。关于聚类网络值数据。神经信息处理系统进展,7071-7081。长滩。
[28] Ng,A.Y.、Jordan,M.I.和Weiss,Y.(2002年)。关于谱聚类:分析和算法。神经信息处理系统进展14,849-856。剑桥。
[29] Pedarsani,P.和Grossglauser,M.(2011年)。关于匿名网络的隐私。第17届ACM SIGKDD知识发现和数据挖掘国际会议论文集,1235-1243。
[30] Tang,M.、Athreya,A.、Sussman,D.L.、Lyzinski,V.和Priebe,C.E.(2017)。随机图的半参数双样本假设检验问题。计算与图形统计杂志26,344-354。
[31] Wang,X.、Hutchinson,R.和Mitchell,T.M.(2003)。训练fMRI分类器以检测多个人类受试者的认知状态。神经信息处理系统进展16,709-716。
[32] Xu,G.,Lin,L.,Wei,P.和Pan,W.(2016)。高维均值的自适应双样本检验。生物特征103、609-624·Zbl 1506.62314号
[33] 袁,M.和温,Q.(2021)。加权随机图的实用双样本检验。应用统计学杂志50495-511·Zbl 07697888号
[34] Zhang,Y.、Levina,E.和Zhu,J.(2017)。通过邻域平滑估计网络边缘概率。生物计量学104771-783·Zbl 07072327号
[35] Zhang,Y.和Xia,D.(2020)。网络时刻的Edgeworth扩展。arXiv:2004.06615。
[36] Zhao,Z.,Chen,L.和Lin,L.(2019)。动态网络中基于graphon估计的变点检测。arXiv:1908.01823年。
[37] 电子邮件:lchen@swun.edu.cnNathaniel Josephs美国北卡罗来纳州立大学统计系,罗利,NC 27695,E-mail:nathaniel.josephs@ncsu.eduLizhen Lin美国马里兰州大学数学系,College Park,MD 20742,E-mail:lizhen01@umd.edu四川大学杰州数学学院,中国成都。
[38] 电子邮件:jzhou@scu.edu.cnEric D.Kolaczyk加拿大蒙特利尔麦吉尔大学数学与统计系。电子邮件:eric.kolaczyk@mcgill.ca(2021年9月收到;2022年4月接受)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。