玛尔塔·库西多·罗查;雅各布·德·乌尼亚-阿尔瓦雷斯;杰弗里·哈特。 高维数据的单变量边际分布相等性的两样本检验。 (英语) Zbl 1428.62247号 《多元分析杂志》。 174,文章ID 104537,20 p.(2019). 摘要:现代统计学中经常出现的一个主题是处理高维数据,其主要特征是变量数量大,但样本量小。在这种情况下,我们的目的是解决检验零假设的问题,即两组变量的边际分布是相同的。我们提出了一个测试统计量,其动机是比较每个变量的经验特征函数(从两个样本计算得出)。导出了混合条件下检验统计量的渐近正态性。在我们的渐近分析中,变量的数量趋于无穷大,而单个样本的大小保持不变。为了获得实际的检验,提出了几个方差估计量,从而得出了三个不同版本的检验。还提出了一种基于置换测试得出的P值的替代全局测试。对提出的测试的有限样本特性进行了模拟研究,并提供了涉及微阵列数据的实际示例。 引用于三文件 MSC公司: 62H15型 多元分析中的假设检验 62G10型 非参数假设检验 62M10个 统计学中的时间序列、自相关、回归等(GARCH) 关键词:特征函数;拟合优度检验;混合条件;置换检验 PDF格式BibTeX公司 XML格式引用 \textit{M.Cousido-Rocha}等人,《多元分析杂志》。174,文章ID 104537,20 p.(2019;Zbl 1428.62247) 全文: 内政部 参考文献: [1] 阿尔巴·费尔南德斯,V。;医学博士Jiménez-Gamero。;Muñoz-Garcia,J.,基于经验特征函数的双样本问题测试,计算。统计师。数据分析。,52, 3730-3748 (2008) ·Zbl 1452.62305号 [2] Bai,Z。;江,D。;姚,J。;郑S.,RMT对大维协方差矩阵LRT的修正,Ann.Statist。,37, 3822-3840 (2009) ·Zbl 1360.62286号 [3] Bai,Z。;Saranadasa,H.,《高维的影响:通过一个双样本问题的例子,统计学家》。Sinica,6311-329(1996)·Zbl 0848.62030号 [4] Y.本杰米尼。;Hochberg,Y.,《控制错误发现率:一种实用且强大的多重测试方法》,J.R.Stat.Soc.Ser。B统计方法。,57, 289-300 (1995) ·Zbl 0809.62014号 [5] Y.本杰米尼。;Yekutieli,D.,《依赖性下多重测试中错误发现率的控制》,《统计年鉴》。,29, 1165-1188 (2001) ·Zbl 1041.62061号 [6] 比斯瓦斯,M。;Gosh,A.K.,《适用于高维数据的非参数双样本检验》,《多元分析杂志》。,123, 160-171 (2014) ·Zbl 1278.62059号 [7] 比斯瓦斯,M。;Mukhopadhyay,M。;Ghosh,A.K.,适用于高维数据的无分布双样本运行测试,Biometrika,101,913-926(2014)·兹比尔1306.62122 [8] Bosq,D.,随机过程的非参数统计:估计和预测(1998),施普林格出版社:施普林格出版社,纽约·Zbl 0902.62099号 [9] Bradley,R.C.,《强混合条件的基本性质》。调查和一些开放性问题,Probab。调查。,2, 107-144 (2005) ·Zbl 1189.60077号 [10] Carlstein,E.,《使用子序列值估计平稳序列的一般统计方差》,《统计年鉴》。,4, 1171-1179 (1996) ·Zbl 0602.62029号 [11] 卡瓦加尔·罗德里格斯,A。;de Uña-Alvarez,J。;Rolán-álvarez,E.,一种新的多测试校正(SGoF),在增加测试数量时增加其统计能力,BMC生物信息学,10209(2009) [12] 卡斯特罗·孔德,I。;Döhler,S。;de Uña-álvarez,J.,《离散数据的扩展sgof多重测试方法》,《统计方法医学研究》,26,2356-2375(2015) [13] Chen,S.X。;Qin,Y.L.,高维数据的双样本检验及其在基因集测试中的应用,Ann.Statist。,38, 2, 808-835 (2010) ·Zbl 1183.62095号 [14] M.Cousido-Rocha、J.de Uña-Alvarez、J.Hart、TwoSampleTest。HD:高维数据分布均匀性的双样本检验,URlhttps://cran.r-project.org/web/packages/TwoSampleTest.HD/index.html; M.Cousido-Rocha、J.de Uña-Alvarez、J.Hart、TwoSampleTest。HD:高维数据分布均匀性的双样本检验,URlhttps://cran.r-project.org/web/packages/TwoSampleTest.HD/index.html [15] M.Cousido-Rocha,J.de Uña-álvarez,J.Hart,《混合条件下大量密度的均匀性测试》,TEST(2019年)。https://doi.org/10.1007/s11749-018-00625-3; M.Cousido-Rocha,J.de Uña-álvarez,J.Hart,《混合条件下大量密度的均匀性测试》,TEST(2019年)。https://doi.org/10.1007/s11749-018-00625-3 ·Zbl 1439.62110号 [16] 多诺霍,D。;Jin,J.,对检测稀疏非均匀混合物的更高批评,Ann.Statist。,32, 3, 962-994 (2004) ·Zbl 1092.62051号 [17] Doukhan,P.,《混合:特性和示例》(1995年),Springer-Verlang,纽约 [18] 范,J。;Yao,Q.,《非线性时间序列:非参数和参数方法》(2003),Springer-Verlag:Springer-Verlag纽约·Zbl 1014.62103号 [19] Fisher,R.A.,《研究工作者的统计方法》(1934年),《奥利弗与博伊德:奥利弗和博伊德·爱丁堡》·JFM 60.1162.01标准 [20] Giraitis,L。;Kokoszka,P.S.(科科什卡,P.S.)。;雷普斯,R。;Teyssière,G.,波动性和水平中长记忆的重新校准方差和相关测试,J.Econometrics,112265-294(2003)·Zbl 1027.62064号 [21] 古普塔,A.K。;Henze,N。;Klar,B.,椭圆对称分布的仿射等价性测试,《多元分析杂志》。,88, 222-242 (2004) ·Zbl 1035.62055号 [22] Hahn,M.,《群体基因组学中的精确推断和估计》,分子生物学。演变。,23, 911-918 (2006) [23] 霍尔,P。;Jin,J.,强依赖下的高级批评属性,Ann.Statist。,36, 381-402 (2008) ·Zbl 1139.62049号 [24] 海登法克,I。;Duggan,D。;陈,Y。;拉德马赫,M。;比特纳,M。;西蒙,R。;梅尔泽,P。;Gusterson,B。;埃斯特勒,M。;O.卡利奥尼埃米。;Wilfond,B。;博格,A。;特伦特,J。;拉菲尔德,M。;Yakhini,Z。;Ben-Dor,A。;Dougherty,E。;Kononen,J。;布本多夫,L。;Fehrle,W。;Pittaluga,S。;Gruvberger,G。;北卡罗来纳州洛曼。;Johannsson,O。;奥尔森,H。;Sauter,G.,遗传性乳腺癌的基因表达谱,北英格兰。《医学杂志》,344539-548(2001) [25] R.Heller,H.Gur,离散测试的错误发现率控制程序,arxiv:1112.4627v2;R.Heller,H.Gur,离散测试的错误发现率控制程序,arxiv:1112.4627v2 [26] Heyse,J.F.,分类数据的错误发现率程序,(Zhang,H.,《生物统计学的最新进展》(2011),世界科学出版公司:新泽西州世界科学出版公司),43-58 [27] 胡,J。;Bai,Z。;王,C。;Wang,W.,关于用不等协方差矩阵检验高维平均向量的相等性,《统计年鉴》。数学。,69, 365-387 (2017) ·Zbl 1396.62106号 [28] 胡总。;罗莎尔斯基,A。;Volodin,A.,关于二阶矩和协方差约束下相依随机变量和的收敛性,Statist。普罗巴伯。莱特。,78, 1999-2005 (2008) ·Zbl 1283.60049号 [29] 胡科娃,M。;Meintanis,S.G.,基于经验特征函数的多变量样本问题测试,J.Nonparametr。统计,20,263-277(2008)·Zbl 1216.62067号 [30] 江,D。;姜涛(Jiang,T.)。;Yang,F.,高维正态分布协方差矩阵的似然比检验,J.Statist。计划。推断,1422241-2256(2012)·Zbl 1244.62082号 [31] Koren,A。;蒂洛什,I。;Barkai,N.,自相关分析揭示了微阵列实验中普遍存在的空间偏差,BMC基因组。,8, 164 (2007) [32] 刘,Z。;夏,X。;Zhou,W.,通过折刀经验似然和特征函数检验两个分布的相等性,计算。统计师。数据分析。,92, 97-114 (2015) ·Zbl 1468.62126号 [33] V.Marmer,计量经济学理论第二讲:第7讲,技术报告Econ627,UBC温哥华经济学院,URLhttp://faulty.arts.ubc.ca/vmarmer/econ627/627_07_2.pdf; V.Marmer,计量经济学理论第二讲:第7讲,技术报告Econ627,UBC温哥华经济学院,URLhttp://faulty.arts.ubc.ca/vmarmer/econ627/627_07_2.pdf [34] 马丁内斯·坎布罗,P。;de Uña-Alvarez,J.,非参数抽样检验:密度函数与分布函数,计算。统计师。数据分析。,53, 3344-3357 (2009) ·Zbl 1453.62152号 [35] Mondal,P.K。;比斯瓦斯,M。;Ghosh,A.K.,《基于最近邻的高维双样本检验》,《多元分析》。,141, 168-178 (2015) ·兹比尔1323.62037 [36] Peligrad,M.,关于弱因随机变量序列的渐近正态性,J.Theor。概率。,9703-715(1996年)·Zbl 0855.60021号 [37] Politis,D.N。;White,H.,针对依赖引导的自动块长度选择,Amer。经济。修订版,23,53-70(2004)·Zbl 1082.62076号 [38] Priestley,M.B.,《谱分析与时间序列》(1981),学术出版社:纽约学术出版社·Zbl 0537.62075号 [39] Radulovic,D.,最小条件下强混合序列平均值的自举,统计量。普罗巴伯。莱特。,28, 65-72 (1996) ·Zbl 0881.62049号 [40] Stouffer,S.A。;苏赫曼,E.A。;德文尼,L.C。;Star,S.A。;威廉姆斯,R.M.,《美国士兵》。《军队生活中的调整》(1949),普林斯顿大学出版社:英国普林斯顿大学出版 [41] Tukey,J.(The Higher Critism.The Higher-crititism,课程笔记,统计学,第411卷(1976),普林斯顿大学) [42] Wei,S。;Lee,C。;Wichers,L。;Marron,J.S.,高维假设检验的方向投影置换,计算机。统计师。数据分析。,25, 549-569 (2016) [43] 詹,D。;Hart,J.,《测试大量密度的相等性》,《生物统计学》,101449-464(2014)·Zbl 1452.62565号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。