王若琳;范伟;王雪芹 两样本多变量分布的基于双曲散度的非参数检验。 (英语。法语摘要) Zbl 07792223号 可以。J.统计。 51,编号4,1034-1054(2023). 摘要:双样本假设检验是统计推断中的一个基本问题,旨在检测两种概率测度之间的差异,在现实世界中有许多应用。当前多元双样本问题的测试程序通常依赖于欧几里德空间中的角度和长度,或用球面模型表示数据后单位超球面中的长度。本文介绍了双曲几何中基于双曲长度的双曲散度,以及随后用于测试多元双样本问题的非参数方法。我们研究了我们的测试过程的性质,发现我们的双曲散度统计与所有其他备选方案是强一致的;我们还证明了它的极限分布是零假设下的(chi^2)分布和替代假设下的正态分布的无限混合。为了计算P值,我们采用了置换方法。此外,在数值研究中,我们在各种分布假设和备选方案下将我们的方法与几种非参数方法进行了比较。我们发现,当分布的复杂相关结构不同时,我们的测试过程具有一些优势。最后,我们检查了一个实际数据集,以说明如何使用我们的方法来测试两个样本的异质性。©2022加拿大统计学会/加拿大统计学会。 MSC公司: 62克10 非参数假设检验 62H15型 多元分析中的假设检验 关键词:双曲散度;双曲面模型;局部参数化;洛伦兹内积;多元双样本检验 PDF格式BibTeX公司 XML格式引用 \textit{R.Wang}等人,加拿大。《美国法律总汇》第51卷,第4期,1034-1054页(2023年;兹bl 07792223) 全文: 内政部 参考文献: [1] Anderson,T.W.(1962年)。关于双样本Cramér‐von Mises准则的分布。《数理统计年鉴》,33(3),1148-1159·Zbl 0116.37601号 [2] Arcones,M.A.和Gine,E.(1992年)。在U和V统计的引导上。《统计年鉴》,20(2),655-674·Zbl 0760.62018号 [3] Chen,H.、Chen,X.和Su,Y.(2018年)。多元和目标数据的加权边缘计数双样本检验。《美国统计协会杂志》,113(523),1146-1155·Zbl 1402.62079号 [4] Chen,H.和Friedman,J.H.(2017)。一种新的基于图形的多变量和对象数据双样本测试。《美国统计协会期刊》,112(517),397-409。 [5] Cortez,P.、Cerdeira,A.、Almeida,F.、Matos,T.和Reis,J.(2009)。通过物理化学特性数据挖掘建立葡萄酒偏好模型。决策支持系统,47(4),547-553。 [6] Gretton,A.、Borgwardt,K.M.、Rasch,M.J.、Schölkopf,B.和Smola,A.(2012)。内核双样本测试。机器学习研究杂志,13(1),723-773·Zbl 1283.62095号 [7] Hotelling,H.(1992)。学生比率的概括。《统计学的突破》,纽约斯普林格出版社,54-65页。 [8] Kim,I.、Balakrishnan,S.和Wasserman,L.(2020年)。通过投影平均进行稳健的多元非参数检验。《统计年鉴》,48(6),3417-3441·Zbl 1460.62087号 [9] Lee,A.J.(2019)。《U‐Statistics:理论与实践》,纽约劳特利奇出版社。 [10] Li,Z.和Zhang,Y.(2020)。关于分布均匀性的两样本检验的投影系综方法。在机器学习国际会议上,PMLR,6020-6027。 [11] Lyons,R.(2013)。度量空间中的距离协方差。《概率年鉴》,41(5),3284-3305·Zbl 1292.62087号 [12] 莱昂斯,R.(2014)。双曲空间具有强负型。伊利诺伊州数学杂志,58(4),1009-1013·Zbl 1328.51005号 [13] Mandrekar,V.S.和Gawarecki,L.(2015)。高斯随机过程和场的随机分析:应用,CRC出版社,博卡拉顿·Zbl 1333.60008号 [14] Neuhaus,G.(1977年)。退化情形下U‐统计量的函数极限定理。多元分析杂志,7(3),424-439·Zbl 0368.60034号 [15] Pan,W.,Tian,Y.,Wang,X.,&Zhang,H.(2018)。球差:非参数双样本检验。《统计年鉴》,46(3),1109·Zbl 1395.62101号 [16] Sen,P.K.(1974年)。广义U-统计量的弱收敛性。概率年鉴,2(1),90-102·Zbl 0276.60008号 [17] 斯米尔诺夫,N.V.(1939)。关于估计两个独立样本的经验分布曲线之间的差异。莫斯科大学数学通报,2(2),3-14。 [18] 学生。(1908). 平均值的可能误差。生物特征,6(1),1-25·Zbl 1469.62201号 [19] Székely,G.J.和Rizzo,M.L.(2004)。高维均匀分布测试。国际统计,5(16.10),1249-1272。 [20] Wang,X.、Zhu,J.、Pan,W.、Zhou,J.和Zhang,H.(2021)。通过度量空间中的度量分布函数进行非参数统计推断。arXiv预印本,arXiv:2107.07317。 [21] Welch,B.L.(1947)。当涉及几个不同的总体方差时,“学生”问题的泛化。《生物统计学》,34(1‐2),28-35·Zbl 0029.40802号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。