×

通过最佳传输过程和多尺度图关联与连接组学应用程序进行有效的双样本图测试。 (英语) 兹伯利07853567

摘要:测试两个图形是否来自同一分布在许多现实世界场景中都很有意义,包括大脑网络分析。在随机点积图模型下,非参数假设检验框架包括使用邻接谱嵌入(ASE)嵌入图,然后使用中值翻转启发式对齐嵌入,最后应用非参数最大平均差(MMD)检验获得p值。使用生成的合成数据果蝇大脑网络,我们证明了中位数翻转启发式导致无效测试,并证明了用于对齐的最优传输Procrustes(OTP)解决了无效性。我们进一步证明,用多尺度图相关(MGC)测试代替MMD测试可以在合成数据和模拟数据中获得更强大的测试。最后,我们将这个强大的测试应用于幼虫的左右半球果蝇蘑菇体脑网络,并得出结论,没有足够的证据来否定两个半球均匀分布的无效假设。
{©2021 John Wiley&Sons有限公司}

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Agterberg,J.、Tang,M.和Priebe,C.(2020a)。具有负特征值和重复特征值的随机图的非参数双样本假设检验。arXiv预印arXiv:2012.09828。
[2] Agterberg,J.、Tang,M.和Priebe,C.E.(2020b)。关于潜在位置随机图模型中两个不同的不可识别性来源。arXiv:2003.14250。
[3] Alvarez‐Melis,D.、Jegelka,S.和Jaakkola,T.S.(2019年)。实现具有全局不变性的最优运输。第22届国际人工智能与统计会议,PMLR,第1870-1879页。
[4] Alyakin,A.A.、Agterberg,J.、Helm,H.S.和Priebe,C.E.(2020年)。修正具有不同顶点数的图的非参数双样本图假设检验。
[5] Arroyo,J.、Athreya,A.、Cape,J.,Chen,G.、Priebe,C.E.和Vogelstein,J.T.(2019年)。具有公共不变子空间的多个异构网络的推理。机器学习研究杂志,22,1-49·Zbl 07415085号
[6] Asta,D.M.和Shalizi,C.R.(2015)。几何网络比较。《第三十一届人工智能不确定性会议论文集》,UAI’15,AUAI出版社,美国弗吉尼亚州阿灵顿,第102-110页。http://dl.acm.org/citation.cfm?id=3020847.3020859
[7] Athreya,A.、Fishkind,D.E.、Tang,M.、Priebe,C.E.、Park,Y.、Vogelstein,J.T.、Levin,K.、Lyzinski,V.、Qin,Y.和Sussman,D.L.(2018)。随机点积图的统计推断:一项调查。机器学习研究杂志,18(226),1-92。http://jmlr.org/papers/v18/17-448.html ·Zbl 1473.05279号
[8] Athreya,A.、Priebe,C.E.、Tang,M.、Lyzinski,V.、Marchette,D.J.和Sussman,D.L.(2015)。随机点积图的标度特征向量的极限定理·兹比尔1338.62061
[9] Bullmore,E.和Sporns,O.(2009年)。复杂脑网络:结构和功能系统的图论分析。《自然评论神经科学》,10(3),186。
[10] Chung,J.、Pedigo,B.D.、Bridgeford,E.W.、Varjavand,B.K.、Helm,H.S.和Vogelstein,J.T.(2019年)。Graspy:用python绘制统计数据。机器学习研究杂志,20(158),1-7。http://jmlr.org/papers/v20/19-490.html
[11] Eichler,K.,Li,F.,Litwin‐Kumar,A.,Park,Y.,Andrade,I.,Schneider‐Mizell,C.M.,Saumweber,T.,Huser,A.,Eschbach,C.,Gerber,B.,&Fetter,R.D.(2017)。昆虫大脑中学习和记忆中心的完整连接体。《自然》,548(7666),175。
[12] Ghoshdastidar,D.、Gutzeit,M.、Carpentier,A.和vonLuxburg,U.(2017)。使用网络统计对大型随机图进行两个样本测试。《2017年学习理论会议论文集》(Kale,S.(ed.)和Shamir,O.(ed.,Eds.),《机器学习研究论文集》,65,PMLR,荷兰阿姆斯特丹,第954-977页。http://proceedings.mlr.press/v65/ghoshdastidar17a.html
[13] Ghoshdastidar,D.、Gutzeit,M.、Carpentier,A.和vonLuxburg,U.(2019年)。非均匀随机图的双样本假设检验。arXiv:1707.00833。
[14] Ginestet,C.E.、Li,J.、Balachandran,P.、Rosenberg,S.和Kolaczyk,E.D.(2017)。功能神经成像中网络数据的假设检验。应用统计年鉴,11(2),725-750。https://projecteuclid.org/download/pdfview_1/euclid.aoas/1500537721 ·Zbl 1391.62217号
[15] Goldenberg,A.、Zheng,A.X.、Fienberg,S.E.和Airoldi,E.M.(2010)。统计网络模型调查。机器学习的基础和趋势,2(2),129-233。https://doi.org/10.1561/2200000005 ·Zbl 1184.68030号 ·doi:10.1561/2200000005
[16] Lee,Y.、Shen,C.、Priebe,C.E.和Vogelstein,J.T.(2019年)。通过扩散图和基于距离的相关性进行网络依赖性测试。Biometrika,106857-873·Zbl 1435.62212号
[17] Levin,K.、Athreya,A.、Tang,M.、Lyzinski,V.和Priebe,C.E.(2017年)。多重随机点积图的综合嵌入的中心极限定理。2017年IEEE数据挖掘研讨会国际会议(icdmw),第964-967页。
[18] Levin,K.和Levina,E.(2019年)。具有潜在空间结构的自举网络。arXiv:1907.10821。
[19] Lyzinski,V.、Sussman,D.L.、Tang,M.、Athreya,A.和Priebe,C.E.(2014)。通过邻接谱嵌入实现随机块模型图的完美聚类。《电子统计杂志》,8(2),2905-2922。https://doi.org/10.1214/14-EJS978 ·Zbl 1308.62131号 ·doi:10.1214/14-EJS978
[20] Maugis,P.‐A.公司。G.、Olhede,S.C.、Priebe,C.E.和Wolfe,P.J.(2020年)。使用子图计数测试网络分布的等效性。计算与图形统计杂志,0(0),1-11。https://doi.org/10.1080/10618600.2020.1736085 ·Zbl 07499288号 ·doi:10.1080/10618600.2020.1736085
[21] Panda,S.、Palaniappan,S.,Xiong,J.、Bridgeford,E.W.、Mehta,R.、Shen,C.和Vogelstein,J.T.(2020年)。hyppo:一个全面的多元假设测试python包。
[22] Rukhin,A.和Priebe,C.E.(2011年)。随机图推理的最大度和大小不变量的比较幂分析。《统计规划与推断杂志》,141(2),1041-1046·Zbl 1353.05113号
[23] Schönemann,P.H.(1966年)。正交procutes问题的广义解。《心理测量学》,31(1),1-10·Zbl 0147.19401号
[24] Shen,C.、Priebe,C.E.和Vogelstein,J.T.(2019a)。从距离相关到多尺度图相关。美国统计协会杂志。
[25] Shen,C.、Priebe,C.E.和Vogelstein,J.T.(2019b)。独立性测试和双样本测试的确切等效性。arXiv:1910.08883。
[26] Shen,C.和Vogelstein,J.T.(2018)。假设检验的距离和核方法的精确等价性。arXiv:1806.05514。
[27] Shen,C.和Vogelstein,J.T.(2019年)。距离相关性的卡方检验。arXiv预印arXiv:1912.12150。
[28] Sussman,D.L.、Tang,M.、Fishkind,D.E.和Priebe,C.E.(2012)。随机块模型图的一致邻接谱嵌入。《美国统计协会期刊》,107(499),1119-1128。https://doi.org/10.1080/01621459.2012.699795 ·Zbl 1443.62188号 ·doi:10.1080/01621459.2012.699795
[29] Sussman,D.L.、Tang,M.和Priebe,C.E.(2014)。随机点积图的一致潜在位置估计和顶点分类。IEEE模式分析和机器智能汇刊,36,48-57。
[30] Szekely,G.和Rizzo,M.(2014)。用不同方法进行部分距离相关。《统计年鉴》,42(6),2382-2412·Zbl 1309.62105号
[31] Tang,M.、Athreya,A.、Sussman,D.L.、Lyzinski,V.、Park,Y.和Priebe,C.E.(2017)。随机图的半参数双样本假设检验问题。计算与图形统计杂志,26(2),344-354。
[32] Tang,M.、Athreya,A.、Sussman,D.L.、Lyzinski,V.和Priebe,C.E.(2017)。随机图的非参数双样本假设检验问题。伯努利,23(3),1599-1630。https://doi.org/10.3150/15-BEJ789 ·Zbl 1450.62040 ·doi:10.3150/15-BEJ789
[33] Vogelstein,J.T.、Wang,Q.、Bridgeford,E.、Priebe,C.E.、Maggioni,M.和Shen,C.(2019年)。发现和破译不同数据模式之间的关系。eLife,8,e41690。
[34] Wasserman,S.和Faust,K.(1994年)。《社会网络分析:方法与应用》,第8卷:剑桥大学出版社。
[35] Zhu,M.和Ghodsi,A.(2006年)。通过使用剖面似然从碎石图中自动选择尺寸。计算统计与数据分析,51(2),918-930·Zbl 1157.62429号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。