×

复杂抽样设计:一致极限定理及其应用。 (英语) Zbl 1475.62090号

摘要:在本文中,我们发展了一种通用的方法来证明由复杂抽样设计引起的Horvitz-Thompson经验过程的全局和局部一致极限定理。证明了Horvitz-Thompson经验过程及其校正版本的全局定理,如Glivenko-Cantelli定理和Donsker定理,以及局部定理,如局部渐近模和相关的比率型极限定理。还建立了其他变量及其条件形式的极限定理。我们的方法揭示了一个有趣的特征:一旦函数类上的常见复杂性条件得到满足,为Horvitz-Thompson经验过程推导一致极限定理的问题本质上并不比建立相应的有限维极限定理困难。然后将这些全局和局部一致极限定理应用于重要的统计问题,包括(i)(M)-估计,(ii)(Z)-估计和(iii)伪贝叶斯过程的频率理论,所有这些都具有加权似然,以说明它们的广泛适用性。

MSC公司:

62D05型 抽样理论、抽样调查
62克20 非参数推理的渐近性质
62G05型 非参数估计
62E20型 统计学中的渐近分布理论
62K20型 响应面设计
2015年1月60日 强极限定理
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Alexander,K.S.(1985)。加权经验过程的增长率。在纪念耶日·奈曼和杰克·基弗的伯克利会议记录,第二卷(加利福尼亚州伯克利,1983年)。华兹华斯统计师/普罗巴伯。序列号。475-493. 加利福尼亚州贝尔蒙特市沃兹沃斯·Zbl 1372.60051号
[2] Alexander,K.S.(1987)。以集合为指标的加权经验过程的中心极限定理。《多元分析杂志》。22 313-339. ·Zbl 0624.60051号 ·doi:10.1016/0047-259X(87)90093-5
[3] Alexander,K.S.(1987)。按集合索引的加权经验过程的增长率和样本模数。普罗巴伯。理论相关领域75 379-423·Zbl 0596.60029号
[4] Barrett,G.F.和Donald,S.G.(2009年)。利用不平等、贫困和福利的广义基尼指数进行统计推断。J.总线。经济。统计师。27 1-17.
[5] Berger,Y.G.(1998)。Horvitz-Thompson估计的渐近方差的收敛速度。J.统计。计划。推论74 149-168·Zbl 1030.62509号 ·doi:10.1016/S0378-3758(98)00107-4
[6] Berger,Y.G.(1998)。Horvitz-Thompson估计量的正态分布收敛速度。J.统计。计划。推断67 209-226·Zbl 1067.62507号 ·doi:10.1016/S0378-3758(97)00107-9
[7] Bertail,P.、Chautru,E.和Clemençon,S.(2017年)。使用(条件)泊松设计进行调查抽样的经验过程。扫描。《美国联邦法律大全》第44卷第97-111页·Zbl 1361.62015年
[8] 巴塔查里亚博士(2007年)。从家庭调查数据推断不平等。《计量经济学杂志》137 674-707·Zbl 1360.62541号 ·doi:10.1016/j.jeconom.2005.09.003
[9] Bhattacharya,D.和Mazumder,B.(2011年)。美国黑人和白人代际收入流动差异的非参数分析。数量。经济。2 335-379.
[10] Boistard,H.、Lopuhaä,H.P.和Ruiz-Gazen,A.(2012年)。拒绝抽样包含概率的近似及其在高阶相关性中的应用。电子。J.Stat.6 1967-1983年·Zbl 1295.62009号 ·doi:10.1214/12-EJS736
[11] Boistard,H.、Lopuhaä,H.P.和Ruiz-Gazen,A.(2017年)。单阶段抽样设计的函数中心极限定理。安。统计师。45 1728-1758. ·Zbl 1459.62013号 ·doi:10.1214/16-AOS1507
[12] Breidt,F.J.和Opsomer,J.D.(2000)。调查抽样中的局部多项式回归估计。安。统计师。28 1026-1053. ·Zbl 1105.62302号 ·doi:10.1214/aos/1015956706
[13] Breslow,N.、McNeney,B.和Wellner,J.A.(2003年)。两阶段结果相关抽样半参数回归模型的大样本理论。安。统计师。31 1110-1139. ·Zbl 1105.62335号 ·doi:10.1214/aos/1059655907
[14] Breslow,N.E.、Lumley,T.、Ballantyne,C.M.、Chambless,L.E.和Kulich,M.(2009年)。两阶段分层样本模型参数的改进Horvitz-Thompson估计:在流行病学中的应用。Stat.Biosci公司。1 32-49.
[15] Breslow,N.E.、Lumley,T.、Ballantyne,C.M.、Chambless,L.E.和Kulich,M.(2009年)。在病例组数据分析中使用整个队列。美国流行病学杂志。169 1398-1405.
[16] Breslow,N.E.和Wellner,J.A.(2007年)。半参数模型和两阶段分层样本的加权似然,应用于Cox回归。扫描。《美国联邦法律大全》第34卷第86-102页·Zbl 1142.62014年 ·数字对象标识代码:10.1111/j.1467-9469.2006.00523.x
[17] Breslow,N.E.和Wellner,J.A.(2008年)。关于“半参数模型和两阶段分层样本的加权似然,及其在Cox回归中的应用”的A(Z)-定理,带有估计的妨害参数和修正注释[Scand.J.Statist.34(2007),no.1,86-102;MR2325244]。扫描。《美国联邦法律大全》第35卷第186-192页·Zbl 1142.62014年 ·doi:10.1111/j.1467-9469.2007.00574.x
[18] Cardot,H.、Chaouch,M.、Goga,C.和Labruère,C.(2010年)。基于设计的功能主成分分析的特性。J.统计。计划。推论140 75-91·Zbl 1178.62067号 ·doi:10.1016/j.jspi.2009.06.012
[19] 卡斯蒂略一世(2012年)。高斯过程先验的半参数Bernstein-von Mises定理。普罗巴伯。理论相关领域152 53-99·Zbl 1232.62054号 ·doi:10.1007/s00440-010-0316-5
[20] Castillo,I.和Nickl,R.(2013)。高斯白噪声中的非参数Bernstein-von Mises定理。安。统计师。41 1999-2028. ·Zbl 1285.62052号 ·doi:10.1214/13-AOS1133
[21] Castillo,I.和Nickl,R.(2014)。非参数贝叶斯过程的Bernstein-von Mises现象。安。统计师。42 1941-1969. ·Zbl 1305.62190号 ·doi:10.1214/14-AOS1246
[22] Castillo,I.和Rousseau,J.(2015)。半参数模型中光滑泛函的Bernstein-von Mises定理。安。统计师。43 2353-2383. ·Zbl 1327.62302号 ·doi:10.1214/15-AOS1336
[23] Chauvet,G.(2015)。多级采样的耦合方法。安。统计师。43 2484-2506. ·Zbl 1331.62071号 ·doi:10.1214/15-AOS1348
[24] Cheng,G.和Huang,J.Z.(2010)。一般半参数估计的Bootstrap一致性。安。统计师。38 2884-2915. ·Zbl 1200.62042号 ·doi:10.1214/10-AOS809
[25] Clémençon,S.、Bertail,P.和Papa,G.(2016)。从调查培训样本中学习:Horvitz-Thompson风险最小化者的费率界限。在142-157年亚洲机器学习会议上。
[26] Conti,P.L.(2014)。关于高熵抽样设计下有限总体分布函数的估计及其应用。Sankhya B 76 234-259号·Zbl 1330.62061号 ·doi:10.1007/s13571-014-0083-x
[27] Davidson,R.(2009)。基尼指数的可靠推断。计量经济学杂志150 30-40·Zbl 1429.91243号 ·doi:10.1016/j.jeconom.2008.11.004
[28] Deville,J.-C.和Särndal,C.-E.(1992年)。调查抽样中的校准估计器。J.Amer。统计师。协会87 376-382·Zbl 0760.62010号 ·doi:10.1080/01621459.1992.10475217
[29] Devroye,L.、Györfi,L.和Lugosi,G.(1996)。模式识别的概率理论。数学应用(纽约)31。纽约州施普林格·Zbl 0853.68150号
[30] Fuller,W.A.(2011年)。抽样统计560。威利。
[31] Ghosal,S.、Ghosh,J.K.和van der Vaart,A.W.(2000)。后验分布的收敛速度。安。统计师。28 500-531. ·Zbl 1105.62315号 ·doi:10.1214/aos/1016218228
[32] Ghosal,S.和van der Vaart,A.(2007年)。非i.i.d.观测的后验分布收敛率。安。统计师。35 192-223. ·兹比尔1114.62060 ·doi:10.1214/09053606000001172
[33] Giné,E.和Koltchinskii,V.(2006年)。比率型经验过程的集中不等式和渐近结果。安·普罗巴伯。34 1143-1216. ·Zbl 1152.60021号
[34] Giné,E.、Koltchinskii,V.和Wellner,J.A.(2003年)。经验过程的比率极限定理。随机不等式及其应用。概率进展56 249-278。巴塞尔Birkhäuser·Zbl 1055.60019号
[35] Giné,E.和Nickl,R.(2016)。无限维统计模型的数学基础。剑桥统计与概率数学系列40。剑桥大学出版社,纽约·Zbl 1358.62014号
[36] Hájek,J.(1961年)。Wald-Wolfowitz-Noether定理的一些推广。安。数学。统计数字32 506-523·Zbl 0107.13404号
[37] 哈耶克,J.(1964年)。有限总体不同概率拒绝抽样的渐近理论。安。数学。《美国联邦法律大全》第35卷第1491-1523页·Zbl 0138.13303号
[38] Hájek,J.(1981)。从有限总体中取样。统计学:教科书和专著37。纽约德克尔,Václav Dupac编辑,P.K.Sen前言·Zbl 0494.62008号
[39] Han,Q.(2017)。贝叶斯模型选择。arXiv预印本,arXiv:1704.07513。
[40] Han,Q.和Wellner,J.A.(2019年)。具有重尾误差的最小二乘回归估计量的收敛速度。安。统计师。47 2286-2319. ·Zbl 1466.60033号
[41] Han,Q.和Wellner,J.A.(2021)。补充“复杂抽样设计:一致极限定理和应用”https://doi.org/10.1214/20-AOS1964SUPP网站
[42] Hartley,H.O.(1962年)。多框架调查。《社会统计学报》第19卷第203-206节。美国统计协会,华盛顿特区。
[43] Hartley,H.O.(1974年)。多框架方法和选定的应用程序。Sankhyá36 118。
[44] Horvitz,D.G.和Thompson,D.J.(1952年)。从有限宇宙中不替换抽样的推广。J.Amer。统计师。协会47 663-685·Zbl 0047.38301号 ·网址:10.1080/01621459.1952.10483446
[45] Huang,J.(1996)。区间截尾比例风险模型的有效估计。统计年鉴。24 540-568. ·兹比尔0859.62032 ·doi:10.1214/aos/1032894452
[46] Koltchinskii,V.(2006年)。风险最小化中的局部Rademacher复杂性和oracle不等式。安。统计师。34 2593-2656. ·Zbl 1118.62065号 ·doi:10.1214/009053606000001019
[47] Koltchinskii,V.(2011)。经验风险最小化和稀疏恢复问题中的Oracle不等式。数学课堂笔记。2033.施普林格,海德堡。2008年在圣面粉学院举行的第38届概率暑期学校的讲座,圣面粉学院。【圣弗洛尔概率暑期学校】·Zbl 1223.91002号
[48] Kosorok,M.R.(2008年)。经验过程和半参数推断导论。统计学中的斯普林格系列。纽约州施普林格·Zbl 1180.62137号
[49] León-Novelo,L.G.和Savitsky,T.D.(2019)。信息抽样下的完全贝叶斯估计。电子。《美国联邦法律大全》第13卷第1608-1645页·兹比尔1443.62158 ·doi:10.1214/19-EJS1538
[50] Lin,D.Y.(2000)。关于将考克斯的比例风险模型拟合到调查数据。生物特征87 37-47·Zbl 0974.62008年 ·doi:10.1093/biomet/87.1.37
[51] Lohr,S.和Rao,J.N.K.(2006年)。多帧调查中的估计。J.Amer。统计师。协会101 1019-1030·Zbl 1120.62301号 ·doi:10.1198/0162145000000195
[52] Lumley,T.、Shaw,P.A.和Dai,J.Y.(2011年)。不完全数据的测量校准估计器和半参数模型之间的联系。国际统计版次79 200-220·Zbl 1422.62048号 ·数字对象标识代码:10.1111/j.1751-5823.011.00138.x
[53] Ma,S.和Kosorok,M.R.(2005年)。稳健半参数M估计和加权自举。《多元分析杂志》。96 190-217. ·Zbl 1073.62030 ·doi:10.1016/j.jmva.2004.09.008
[54] Mammen,E.和Tsybakov,A.B.(1999年)。平滑判别分析。安。统计师。27 1808-1829. ·Zbl 0961.62058号 ·doi:10.1214/aos/1017939240
[55] Mason,D.M.、Shorack,G.R.和Wellner,J.A.(1983年)。一致经验过程振动模的强极限定理。Z.Wahrsch公司。版本。Gebiete 65 83-97·兹比尔0506.60025 ·doi:10.1007/BF00534996
[56] Nan,B.、Kalbfleisch,J.D.和Yu,M.(2009)。具有缺失数据的半参数加速失效时间模型的渐近理论。安。统计师。37 2351-2376. ·Zbl 1173.62073号 ·doi:10.1214/08-AOS657
[57] Nan,B.和Wellner,J.A.(2013年)。用于案例研究的一般半参数Z估计方法。统计师。Sinica西尼卡23 1155-1180·Zbl 06202702号
[58] Nickl,R.(2017)。统计反问题的Bernstein-von Mises定理I:Schrödinger方程,arXiv预印本arXiv:1707.01764·兹比尔1445.62099
[59] Nickl,R.和Söhl,J.(2019年)。统计反问题的Bernstein-von Mises定理II:复合泊松过程。电子。《美国法律总汇》第13卷第3513-3571页·Zbl 1429.62168号 ·doi:10.1214/19-EJS1609
[60] Prstgaard,J.和Wellner,J.A.(1993年)。一般经验过程的可交换加权自举。安·普罗巴伯。21 2053-2086. ·Zbl 0792.62038号 ·doi:10.1214/aop/1176989011
[61] Rosén,B.(1965年)。有限总体抽样的极限定理。方舟材料5 383-424·Zbl 0127.10503号
[62] Rosén,B.(1967年)。关于一类抽样过程的中心极限定理。Z.Wahrsch公司。版本。Gebiete 7 103-115·Zbl 0171.16307号
[63] Rosén,B.(1972年)。具有不同概率的连续抽样的渐近理论,无需替换。一、 二、。安。数学。《美国联邦法律大全》第43卷第373-397页;同上,43(1972),748-776·Zbl 0246.60018号
[64] Rosén,B.(1974年)。Des Raj估计量的渐近理论。一、 二、。扫描。《美国联邦法律大全》第1卷第71-83页;同上1(1974),第3号,135-144·Zbl 0294.62008号
[65] Rubin-Bleuer,S.和Schiopu Kratina,I.(2005)。关于联合模型和基于设计的推理的两阶段框架。安。统计师。33 2789-2810·Zbl 1084.62020年 ·doi:10.1214/009053605000000651
[66] Saegusa,T.(2014)。自举两相采样。arXiv预印本,arXiv:1406.5580·兹比尔1419.62023 ·doi:10.1111/sjos.12152
[67] Saegusa,T.(2015)。两阶段抽样下的方差估计。扫描。《美国联邦法律大全》第42卷第1078-1091页·Zbl 1419.62023号 ·doi:10.1111/sjos.12152
[68] Saegusa,T.(2019)。多来源合并数据的大样本理论。安。统计师。47 1585-1615. ·Zbl 1418.62256号 ·doi:10.1214/18-AOS1727
[69] Saegusa,T.和Wellner,J.A.(2013年)。两阶段抽样下的加权似然估计。安。统计师。41 269-295. ·Zbl 1347.62033号 ·doi:10.1214/12-AOS1073
[70] Särndal,C.-E.,Swensson,B.和Wretman,J.(1992)。模型辅助调查抽样。统计学中的斯普林格系列。纽约州施普林格·Zbl 0742.62008号
[71] Savitsky,T.D.和Toth,D.(2016)。信息抽样下的贝叶斯估计。电子。《美国联邦法律大全》第10卷第1677-1708页·Zbl 1397.62117号 ·doi:10.1214/16-EJS1153
[72] Shorack,G.R.(1973)。简化经验过程和分位数过程的收敛性,并应用于非I.I.D.情况下的顺序统计函数。安。统计师。1 146-152. ·Zbl 0255.62044号 ·doi:10.1214/aos/1193342391
[73] Shorack,G.R.和Wellner,J.A.(1982年)。以区间为指标的一致经验过程的极限定理和不等式。安·普罗巴伯。10 639-652. ·兹伯利0497.60026 ·doi:10.1214/aop/1176993773
[74] 斯图特,W.(1982)。经验过程的振荡行为。安·普罗巴伯。10 86-107. ·Zbl 0489.60038号 ·doi:10.1214/aop/1176993915
[75] Stute,W.(1984)。经验过程的振荡行为:多元情况。安·普罗巴伯。12 361-379. ·Zbl 0533.62037号 ·doi:10.1214/op/1176993295
[76] Tsybakov,A.B.(2004)。统计学习中分类器的最优聚合。安。统计师。32 135-166. ·Zbl 1105.62353号 ·doi:10.1214/aos/1079120131
[77] van de Geer,S.A.(2000年)。经验过程理论的应用。剑桥统计与概率数学系列6。剑桥大学出版社,剑桥·Zbl 0953.62049号
[78] van der Vaart,A.(2002)。半参数统计。《概率论和统计学讲座》(Saint-Flour,1999)。数学课堂笔记。1781 331-457. 柏林施普林格·Zbl 1013.62031号
[79] van der Vaart,A.W.(1995)。无穷维估计的效率。内尔统计局。49 9-30. ·Zbl 0830.62029号 ·文件编号:10.1111/j.1467-9574.1995.tb01452.x
[80] van der Vaart,A.W.(1998)。渐进统计。剑桥统计与概率数学系列3。剑桥大学出版社,剑桥·Zbl 0910.62001号
[81] van der Vaart,A.W.和Wellner,J.A.(1996)。弱收敛与经验过程:统计应用。统计学中的斯普林格系列。纽约州施普林格·兹比尔0862.60002
[82] 维舍克,J.á。(1979). 拒绝抽样、桑福德抽样和连续抽样的简单估计的渐近分布。统计贡献263-275。多德雷赫特·雷德尔·Zbl 0422.62008号
[83] Wellner,J.A.(1978年)。经验分布函数与真分布函数之比的极限定理。Z.Wahrsch公司。版本。Gebiete 45 73-88·Zbl 0382.60031号 ·doi:10.1007/BF00635964
[84] Wellner,J.A.和Zhan,Y.(1996年)。自举Z估计器。技术报告308,华盛顿大学统计部。
[85] J.韦纳·Zbl 1126.62084号 ·doi:10.1214/009053600700000181
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。