×

基于Wasserstein距离的多变量优良性检验。 (英语) Zbl 1471.62379号

摘要:针对涉及一般多元分布的简单和复合零假设,提出了基于经验Wasserstein距离的优度检验。对于成组族,在通过不变性对数据进行初步约简后执行该过程。此属性允许计算有限样本大小下的精确临界值和(p)-值。应用包括测试位置尺度族和测试仿射变换产生的族,例如具有给定标准径向密度和未指定位置向量和散布矩阵的椭圆分布。一种新的未指定平均向量和协方差矩阵的多元正态性检验是一种特殊情况。对于更一般的参数族,我们建议使用参数引导程序来计算临界值。经验Wasserstein距离缺乏渐近分布理论,这意味着在零假设下参数自举的有效性仍然是一个猜想。然而,我们表明,该测试与固定备选方案是一致的。为此,我们证明了Wasserstein距离中经验分布的一致大数定律,其中一致性在满足一致可积条件但没有附加矩假设的任何一类基本分布上。测试统计量的计算归结为解决经过充分研究的半离散最优运输问题。大量的数值实验证明了所提出的Wasserstein距离的阶数(p=1)和(p=2)以及维数至少达到(d=5)的测试的实际可行性和优异性能。仿真也支持了参数引导的渐近有效性猜想。

MSC公司:

62H15型 多元分析中的假设检验
62小时05 多元概率分布的表征与结构理论;连接线
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Ambrosio,L.、Stra,F.和Trevisan,D.(2018年)。二维匹配问题的PDE方法。概率论及其相关领域1-45.
[2] Azzalini,A.(2014)。Skew-Normal及其相关族.数理统计研究所(IMS)专著3.剑桥大学出版社,与Antonella Capitanio合作·Zbl 1338.62007号
[3] Azzalini,A.(2020年)。R包:Skew-Normal和相关分布,如Skew-\(t\)。,意大利帕多瓦大学。
[4] Bakshaev,A.和Rudzkis,R.(2015)。基于核密度估计的多变量优良性检验。非线性分析。建模和控制20 585-602. ·Zbl 1420.62156号
[5] Beirlant,J.、Goegebeur,Y.、Segers,J.,Teugels,J.L.、De Waal,D.和Ferro,C.(2004)。极值统计:理论与应用威利·兹比尔1070.62036
[6] Beran,R.(1997)。诊断引导成功。统计数学研究所年鉴49 1-24. ·Zbl 0928.62035号
[7] Bickel,P.J.和Freedman,D.A.(1981年)。引导的一些渐近理论。统计年鉴9 1196-1217. ·Zbl 0449.62034号 ·doi:10.1214/aos/1176345637
[8] Bickel,P.J.和Rosenblatt,M.(1973年)。关于密度函数估计偏差的一些全局度量。统计年鉴1 1071-1095. ·Zbl 0275.62033号
[9] Bickel,P.J.、Klaassen,C.A.J.、Ritov,Y.和Wellner,J.A.(1993)。半参数模型的有效自适应估计.约翰·霍普金斯数理科学系列约翰·霍普金斯大学出版社,马里兰州巴尔的摩·Zbl 0786.62001号
[10] Bobkov,S.和Ledoux,M.(2019)。一维经验测度、订单统计和Kantorovich运输距离。内存。阿默尔。数学。Soc公司。261伏+126伏·Zbl 1454.60007号
[11] Cambanis,S.、Huang,S.和Simons,G.(1981年)。椭圆等高分布理论。多元分析杂志11 368-385. ·Zbl 0469.60019号
[12] Capanu,M.(2019年)。一种统一的方法来证明一些优秀测试的参数引导一致性。统计53 58-80. ·Zbl 1411.62046号
[13] Carlier,G.、Chernozhukov,V.、Galichon,A.等人(2016年)。向量分位数回归:一种最佳传输方法。统计年鉴44 1165-1192. ·Zbl 1381.62239号
[14] Chernozhukov,V.、Galichon,A.、Hallin,M.、Henry,M.等人(2017年)。Monge-Kantorovich深度、分位数、等级和符号。统计年鉴45 223-256. ·Zbl 1426.62163号
[15] Cramér,A.(1928)。关于基本错误的构成。斯堪的纳维亚精算杂志1 13-74.
[16] del Barrio,E.、Giné,E.和Utzet,F.(2005)。经验分位数过程[{L_2}]泛函的渐近性,以及在基于加权Wasserstein距离的拟合检验中的应用。伯努利11 131-189. ·Zbl 1063.62072号
[17] del Barrio,E.和Loubes,J.M.(2019年)。一般维经验运输成本的中心极限定理。概率年鉴47 926-951. ·Zbl 1466.60042号
[18] del Barrio,E.、Cuesta-Albertos,J.A.、Matrán,C.和Rodríguez,J.M.(1999)。基于\[{L_2}\]-Wasserstein距离的拟合优度检验。统计年鉴27 1230-1239. ·Zbl 0961.62037号
[19] del Barrio,E.、Cuesta-Albertos,J.A.、Matrán,C.、Csörgö,S.、Cuadras,C.M.、de Wet,T.、Giné,E.、Lockhart,R.、Munk,A.和Stute,W.(2000)。经验过程和分位数过程对质量检验渐近理论的贡献。测试9 1-96. ·Zbl 0997.62034号
[20] Ebner,B.、Henze,N.和Yukich,J.E.(2018年)。通过最近邻距离在平坦和弯曲空间上的多元拟合优度。多元分析杂志165 231-242·兹比尔1397.62201
[21] Fan,Y.(1997)。通过经验特征函数对多元分布进行有效性检验。多元分析杂志62 36-63. ·Zbl 0949.62044号
[22] Fang,K.-T.,Kotz,S.和Ng,K.-W.(1990年)。对称多元及相关分布查普曼和霍尔,伦敦·Zbl 0699.62048号
[23] Fournier,N.和Guillin,A.(2015)。关于经验测度的Wasserstein距离的收敛速度。概率论及其相关领域162 707-738. ·Zbl 1325.60042号
[24] Genest,C.、Ghoudi,K.和Rivest,L.P.(1995)。多元分布族中相依参数的半参数估计过程。生物特征82 543-552. ·Zbl 0831.62030号 ·doi:10.1093/biomet/82.3543
[25] Genevay,A.、Cuturi,M.、Peyré,G.和Bach,F.(2016)。大规模最优运输的随机优化。神经信息处理系统研究进展3440-3448.
[26] Goldfeld,Z.和Kato,K.(2020年)。光滑Wasserstein距离的极限分布理论及其在生成模型中的应用。arXiv预印本2002.01012.
[27] Golub,G.H.和Van Loan,C.F.(1996年)。矩阵计算第三版,约翰·霍普金斯大学出版社,巴尔的摩和伦敦·Zbl 0865.65009号
[28] Hallin,M.、del Barrio,E.、Cuesta Albertos,J.和Matrán,C.(2020年)。维(d)中的分布和分位数函数、秩和符号:一种度量传递方法。统计年鉴(出现)·Zbl 1468.62282号
[29] Hartmann,V.和Schuhmacher,D.(2020年)。半离散最优输运:无平方欧几里德距离情形的求解过程。运筹学的数学方法92 133-163. ·Zbl 1457.65014号
[30] Henze,N.和Zirkler,B.(1990年)。多元正态性的一类不变一致性检验。统计传播。理论与方法19 3595-3617. ·Zbl 0738.62068号
[31] Hofert,M.、Kojadinovic,I.、Maechler,M.和Yan,J.(2018)。copula:Copulas R软件包版本0.999-19.1的多变量依赖性。
[32] Horowitz,J.和Karandikar,R.L.(1994年)。Wasserstein距离中经验测度的平均收敛速度。计算与应用数学杂志55 261-273. ·Zbl 0819.60031号
[33] Joe,H.(2005)。基于连接函数模型的两阶段估计方法的渐近效率。多元分析杂志94 401-419. ·Zbl 1066.62061号
[34] Khmaladze,E.V.(2016)。统一变换、经验过程和无分布测试。伯努利22 563-588. ·Zbl 1345.60094号
[35] Kitagawa,J.、Mérigot,Q.和Thibert,B.(2017)。半离散最优运输牛顿算法的收敛性。arXiv预印本1603.05579v2·Zbl 1439.49053号
[36] 科尔莫戈罗夫(1933)。Sulla determinazione experimenta di una legge di distribuzione公司。Giornale dell’Instituto Italiano degli Attuari意大利学院4 83-91.
[37] Korkmaz,S.、Goksuluk,D.和Zararsiz,G.(2014)。MVN:评估多元正态性的R包。R杂志6 151-162.
[38] Lehmann,E.L.和Casella,G.(1998年)。点估计理论第二版,Springer Science+Business Media,纽约·Zbl 0916.62017号
[39] Lévy,B.(2015)。三维L2半离散最优运输的数值算法。ESAIM:数学建模和数值分析49 1693-1715. ·Zbl 1331.49037号
[40] 马萨特,P.(1990)。Dvoretsky-Kiefer-Wolfowitz不等式中的紧常数。概率年鉴18 1269-1283. ·Zbl 0713.62021号
[41] McAssey,M.P.(2013)。多元分布的经验优良性检验。应用统计学杂志40 1120-1131·兹比尔1514.62752
[42] Mena,G.和Niles Weed,J.(2019)。熵最优输运的统计界:样本复杂性和中心极限定理。神经信息处理系统研究进展4541-4551.
[43] Mérigot,Q.(2011)。优化运输的多尺度方法。计算机图形论坛30 1583-1592. 威利在线图书馆。
[44] Munk,A.和Czado,C.(1998年)。相似分布的非参数验证和拟合优度评估。英国皇家统计学会杂志:B辑(统计方法)60 223-241. ·Zbl 0909.62047号
[45] Panaretos,V.M.和Zemel,Y.(2019年)。Wasserstein距离的统计方面。统计及其应用年鉴6 405-431.
[46] Peyré,G.和Cuturi,M.(2019年)。计算最优运输。机器学习的基础和趋势11 355-607.
[47] Ramdas,A.、GarcíA Trillos,N.和Cuturi,M.(2017年)。关于Wasserstein双样本检验和相关非参数检验家族。19第47、15号论文。
[48] Rippl,T.、Munk,A.和Sturm,A.(2016年)。经验Wasserstein距离的极限定律:高斯分布。多元分析杂志151 90-109. ·Zbl 1351.62064号
[49] Rizzo,M.L.和Székely,G.J.(2016)。能量距离。威利跨学科评论:计算统计学8 27-38.
[50] Royston,J.P.(1983年)。基于Shapiro-Wilk W。英国皇家统计学会杂志:C辑(应用统计学)32 121-133. ·Zbl 0536.62043号
[51] Santambrogio,F.(2015)。应用数学家的最佳传输.非线性微分方程及其应用进展87.比克哈泽/施普林格,查姆·Zbl 1401.49002号
[52] Schmidt,M.、Le Roux,N.和Bach,F.(2017)。用随机平均梯度最小化有限和。数学规划162. ·Zbl 1358.90073号
[53] Schuhmacher,D.、Bähre,B.、Gottschlich,C.、Hartmann,V.、Heinemann,F.和Schmitzer,B.(2019年)。运输:最佳运输计划和Wasserstein距离R包0.12-1版的计算。
[54] 斯米尔诺夫,N.V.(1939)。关于估计两个独立样本的经验分布曲线之间的差异。牛市。数学。莫斯科大学2 3-14.
[55] Smith,S.P.(1995)。Cholesky算法的区分。计算与图形统计杂志4 134-147.
[56] Sommerfeld,M.和Munk,A.(2018年)。有限空间上经验Wasserstein距离的推论。英国皇家统计学会杂志:B辑(统计方法)80 219-238. ·Zbl 1380.62121号
[57] Tameling,C.、Sommerfeld,M.和Munk,A.(2019年)。可数度量空间上的经验最优传输:分布极限和统计应用。应用概率年鉴29 2744-2781. ·Zbl 1439.60028号
[58] R核心团队(2018年)。R: 统计计算语言和环境R统计计算基金会,奥地利维也纳。
[59] van der Vaart,A.W.(1998)。渐近统计剑桥大学出版社,剑桥·Zbl 0910.62001号
[60] van der Vaart,A.W.和Wellner,J.A.(1996)。弱收敛和经验过程。统计应用纽约斯普林格·弗拉格·兹比尔0862.60002
[61] Villani,C.(2009年)。最佳交通:新旧柏林斯普林格·弗拉格·Zbl 1156.53003号
[62] 冯·米塞斯(von Mises,R.E.)(1928)。Wahrscheinlichkeit、Statistik和WahrheitJulius Springer,柏林。
[63] Weed,J.和Bach,F.(2019年)。Wasserstein距离中经验测度收敛的尖锐渐近和有限样本率。伯努利25 2620-2648·兹比尔1428.62099
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。