×

通过自举法对亏损估计量进行非参数推断。 (英语) Zbl 1418.62205号

小结:在本文中,我们建议通过引导缺失的核密度估计(用于密度估计)和缺失的局部多项式回归估计(用于回归分析)来构造置信带。最近S.Calonico公司等[J.Am.Stat.Assoc.113,No.522,767–779(2018;Zbl 1398.62113号)]通过显式估计随机变量,在给定点构造密度函数(和回归函数)的置信区间。我们扩展了他们使用debiased估计器的思想,并进一步提出了一种构造同时置信带的bootstrap方法。这种改进方法的优点是,我们可以很容易地从传统的带宽选择器中选择平滑带宽,并且置信带将是渐近有效的。我们证明了bootstrap置信带的有效性,并将其推广到密度水平集和逆回归问题。仿真研究证实了所提出置信带/集的有效性。我们将我们的方法应用于天文学数据集,以显示其适用性。

MSC公司:

62G15年 非参数容差和置信区域
62G09号 非参数统计重采样方法
62G07年 密度估算
62G08号 非参数回归和分位数回归
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] J.Abrevaya、Y.-C.Hsu和R.P.Lieli。估计条件平均治疗效果。,《商业与经济统计杂志》,33(4):485-5052015年。
[2] J.K.Adelman McCarthy、M.A.Agüeros、S.S.Allam、C.A.Prieto、K.S.Anderson、S.F.Andersons、J.Annis、N.A.Bahcall、C.Bailer-Jones、I.K.Baldry等。斯隆数字天空测量的第六次数据发布。,《天体物理学杂志增刊系列》,175(2):2972008。
[3] R.巴哈杜尔。关于大样本中分位数的注释。,《数理统计年鉴》,37(3):577-5801966·Zbl 0147.18805号 ·doi:10.1214/aoms/1177699450
[4] O.Bartalotti、G.Calhoun和Y.He。尖锐回归不连续设计的Bootstrap置信区间。《回归间断设计:理论与应用》,第421-453页。Emerald Publishing Limited,2017年。
[5] S.M.Berry、R.J.Carroll和D.Ruppert。测量误差问题的贝叶斯平滑和回归样条。,美国统计协会杂志,97(457):160-1692002·Zbl 1073.62524号 ·doi:10.1198/016214502753479301
[6] M.Birke、N.Bissantz和H.Holzmann。逆回归模型的置信带。,反问题,26(11):1150202010·Zbl 1203.62060号 ·doi:10.1088/0266-5611/26/11/115020
[7] N.Bissantz和M.Birke。带卷积型算子的逆回归模型的渐近正态性和置信区间。,多元分析杂志,100(10):2364-23752009·Zbl 1175.62035号 ·doi:10.1016/j.jmva.2009.04.004
[8] S.Bjerve、K.A.Doksum和B.S.Yandell。基于简单移动平均数的回归的一致置信界。,《斯堪的纳维亚统计杂志》,第159-169页,1985年·Zbl 0602.62034号
[9] M.R.Blanton、D.J.Schlegel、M.A.Strauss、J.Brinkmann、D.Finkbeiner、M.Fukugita、J.E.Gunn、D.W.Hogg等。Ivezić,G.Knapp等人,《纽约大学增值星系目录:基于新公共调查的星系目录》。,《天文学杂志》,129(6):25622005。
[10] P.J.P.J.Brown。,测量、回归和校准。编号04;QA278.2,B7。1993. ·Zbl 0829.62064号
[11] J.L.O.卡布雷拉。locpol:内核局部多项式回归。,统一资源定位地址http://mirrors.ustc.edu.cn/CRAN/web/packages/locpol/index.html, 2018.
[12] B.干部。密度水平集的核估计。,多元分析杂志,97(4):999-10232006·Zbl 1085.62039号 ·doi:10.1016/j.jmva.2005.05.004
[13] S.Calonico、M.D.Cattaneo和M.H.Farrell。关于非参数推理中偏差估计对覆盖精度的影响。,arXiv预印arXiv:1508.029732015·Zbl 1398.62113号 ·doi:10.1080/01621459.2017.1285776
[14] S.Calonico、M.D.Cattaneo和M.H.Farrell。覆盖误差最优置信区间。,arXiv预打印arXiv:1808.013982018a·Zbl 1398.62113号 ·doi:10.1080/01621459.2017.1285776
[15] S.Calonico、M.D.Cattaneo和M.H.Farrell。关于非参数推理中偏差估计对覆盖精度的影响。,《美国统计协会杂志》,第1-13页,2018b·Zbl 1398.62113号 ·doi:10.1080/01621459.2017.1285776
[16] G.卡尔森。拓扑和数据。,美国数学学会公报,46(2):255-3082009·Zbl 1172.62002号 ·doi:10.1090/S0273-0979-09-01249-X
[17] L.骑士。回归水平集的非参数估计。,统计学理论与应用统计学杂志,29(2):131-1601997·Zbl 0899.62045号 ·doi:10.1080/0233189708802579
[18] J.Chacón、T.Duong和M.Wand。一般多元核密度导数估计的渐近性。,中国统计局,2011年·Zbl 1214.62039号
[19] F.Chazal、B.T.Fasy、F.Lecci、A.Rinaldo和L.Wasserman。持久性景观和轮廓的随机收敛。年,第三十届计算几何年度研讨会论文集,第474页。ACM,2014年·Zbl 1395.62187号
[20] S.X.陈。非参数密度估计的经验似然置信区间。,《生物统计学》,83(2):329-34119996年·Zbl 0864.62017年 ·doi:10.1093/biomet/83.2.329
[21] Y.-C.Chen(陈永昌)。广义聚类树与奇异测度。,arXiv预印arXiv:1611.02762016。
[22] Y.-C.Chen、C.R.Genovese和L.Wasserman。密度脊的渐近理论。,《统计年鉴》,43(5):1896-1928,2015a·Zbl 1327.62303号 ·doi:10.1214/15-AOS1329
[23] Y.C.Chen、S.Ho、P.E.Freeman、C.R.Genovese和L.Wasserman。通过密度脊重建宇宙网:方法和算法。,皇家天文学会月刊,454(1):1140-1156,2015b。
[24] Y.C.Chen、S.Ho、J.Brinkmann、P.E.Freeman、C.R.Genovese、D.P.Schneider和L.Wasserman。通过密度脊重建宇宙网:目录。,英国皇家天文学会月报,第1页w15542016a。
[25] Y.C.Chen、S.Ho、R.Mandelbaum、N.A.Bahcall、J.R.Brownstein、P.E.Freeman、C.R.Genovese、D.P.Schneider和L.Wasserman。在斯隆数字天空测量iii中探测丝状物对星系特性的影响,《皇家天文学会月刊》,第stw31272016b页。
[26] Y.-C.Chen、C.R.Genovese和L.Wasserman。密度水平集:渐近、推理和可视化。,《美国统计协会杂志》,2017年第1-13页。
[27] V.Chernozhukov、D.Chetverikov和K.Kato。高维随机向量和最大值的高斯近似和乘数自举。,《统计年鉴》,41(6):2786-28192013·Zbl 1292.62030 ·doi:10.1214/13-AOS1161
[28] V.Chernozhukov、D.Chetverikov和K.Kato。反集中和诚实,自适应置信区间。,《统计年鉴》,42(5):1787-18182014a·Zbl 1305.62161号 ·doi:10.1214/14-AOS1235
[29] V.Chernozhukov、D.Chetverikov和K.Kato。高斯随机向量极大值的比较和反集中界。,概率论及相关领域,第1-24页,2014b·Zbl 1319.60072号 ·doi:10.1007/s00440-014-0565-9
[30] V.Chernozhukov、D.Chetverikov和K.Kato。经验过程上确界的高斯近似。,《统计年鉴》,42(4):1564-15972014c·Zbl 1317.60038号 ·doi:10.1214/14-AOS1230
[31] V.Chernozhukov、D.Chetverikov和K.Kato。增加复杂性的经验过程的上确界的经验和乘数自举,以及相关的高斯耦合。,随机过程及其应用,2016年·Zbl 1351.60035号 ·doi:10.1016/j.spa.2016.04.009
[32] V.Chernozhukov,D.Chetverikov,K.Kato等人,《高维中心极限定理和bootstrap》。,概率年鉴,45(4):2309-23522017·Zbl 1377.60040号 ·数字对象标识代码:10.1214/16-AOP1113
[33] H.D.Chiang、Y.-C.Hsu和Y.Sasaki。锐利/模糊均值/分位数回归间断/扭结设计的统一稳健bootstrap方法。,arXiv预印arXiv:1702.044302017。
[34] N.B.Cowan和。伊维齐奇。低红移星系的环境。,《天体物理学杂志快报》,674(1):L132008。
[35] A.Cuevas、W.González-Manteiga和A.Rodríguez-Casal。一般水平集的插件估计。,澳大利亚和新西兰统计杂志,48(1):7-192006·Zbl 1108.62036号
[36] T.Duong(多昂)。与非参数双样本测试的局部显著差异。,非参数统计杂志,25(3):635-6452013·Zbl 1416.62243号 ·doi:10.1080/10485252.2013.810217
[37] T.Duong和M.L.Hazelton。多元核密度估计的交叉验证带宽矩阵。,《斯堪的纳维亚统计杂志》,32(3):485-5062005·Zbl 1089.62035号 ·doi:10.1111/j.1467-9469.2005.00445.x
[38] T.Duong、I.Koch和M.Wand。流式细胞术数据应用中的最高密度差区域估计。,《生物医学杂志》,51(3):504-5212009年·Zbl 1442.62340号
[39] T.Duong等人.ks:r中多元数据的核密度估计和核判别分析,《统计软件杂志》,21(7):1-162007。
[40] H.Edelsbrunner和D.Morozov。持久的同源性:理论与实践。《欧洲数学大会论文集》,第31-50页,2012年·兹比尔1364.55008
[41] B.埃夫隆。引导方法:再看一下折刀。,《统计年鉴》,7(1):1-261979年·Zbl 0406.62024号 ·doi:10.1214/aos/1176344552
[42] U.Einmahl和D.M.Mason。核型函数估计量的带宽一致性。,《统计年鉴》,33(3):1380-14032005·Zbl 1079.62040号 ·doi:10.1214/009053605000000129
[43] D.J.Eisenstein、D.H.Weinberg、E.Agol、H.Aihara、C.A.Prieto、S.F.Anderson、J.A.Arns等。Aubourg,S.Bailey,E.Balbinot,et al.Sdss-iii:对遥远宇宙、银河系和星外行星系统的大规模光谱测量。,《天文学杂志》,142(3):722011年。
[44] R.L.Eubank和P.L.Speckman。非参数回归的置信带。,美国统计协会杂志,88(424):1287-13011993·Zbl 0792.62030号 ·doi:10.1080/01621459.1993.10476410
[45] J.范。局部线性回归平滑器及其极大极小效率。,《统计年鉴》,第196-2161993页·Zbl 0773.62029号 ·doi:10.1214/aos/1176349022
[46] J.Fan和I.Gijbels。,局部多项式建模及其应用:统计学和应用概率专著66卷。CRC出版社,1996年。
[47] B.T.Fasy、F.Lecci、A.Rinaldo、L.Wasserman、S.Balakrishnan和A.Singh。持久性图的置信集。,《统计年鉴》,42(6):2301-23392014年·Zbl 1310.62059号 ·doi:10.1214/14-AOS1252
[48] D.A.弗里德曼。引导回归模型。,《统计年鉴》,9(6):1218-12281981年·Zbl 0449.62046号 ·doi:10.1214/aos/1176345638
[49] C.R.Genovese、M.Perone-Pacifico、I.Verdinelli和L.Wasserman。关于梯度场的路径密度。,《统计年鉴》,37(6A):3236-32712009年·Zbl 1191.62062号 ·doi:10.1214/08-AOS671
[50] C.R.Genovese、M.Perone-Pacifico、I.Verdinelli和L.Wasserman。非参数岭估计。,《统计年鉴》,42(4):1511-15452014·Zbl 1310.62045号 ·doi:10.1214/14-AOS1218
[51] E.Giné和A.Guillou。多元核密度估计的强一致相合率。年,《亨利·庞加莱研究所年鉴》(B)《概率与统计》,第38卷,第907-921页。爱思唯尔,2002年·Zbl 1011.62034号 ·doi:10.1016/S0246-0203(02)01128-7
[52] M.-A.格鲁特。非参数校准分析。,《统计年鉴》,24(4):1474-14921996·Zbl 0867.62028号 ·doi:10.1214/aos/1032298278
[53] R.Grützbauch、C.J.Conselice、J.Varela、K.Bundy、M.C.Cooper、R.Skibba和C.N.Willmer。星系环境有什么关系?palomar/deep2观测中星系环境、颜色和恒星质量之间的关系。,皇家天文学会月刊,411(2):929-9462011。
[54] P.霍尔。密度估计中最小二乘交叉验证的大样本优化。,《统计年鉴》,11(4):1156-1174,12 1983年·Zbl 0599.62051号 ·doi:10.1214/aos/1176346329
[55] P.霍尔。关于非参数回归中的bootstrap置信区间。,《统计年鉴》,20(2):695-7111992a·Zbl 0765.62049号 ·doi:10.1214/aos/1176348652
[56] P.霍尔。偏差估计对概率密度的自举置信区间的覆盖精度的影响。,《统计年鉴》,20(2):675-6941992b·Zbl 0748.62028号 ·doi:10.1214/aos/1176348651
[57] P.Hall和J.Horowitz。构造函数非参数置信带的简单bootstrap方法。,《统计年鉴》,41(4):1892-1921,2013年·Zbl 1277.62120号 ·doi:10.1214/13-AOS1137
[58] P.霍尔和A.B.欧文。密度估计中的经验似然置信带。,计算与图形统计杂志,2(3):273-2891993。
[59] W.Härdle和A.W.Bowman。非参数回归中的自举:局部自适应平滑和置信带。,美国统计协会杂志,83(401):102-1101988·Zbl 0644.62047号
[60] W.Hardle和J.Marron。非参数回归的Bootstrap同步误差条。,《统计年鉴》,19(2):778-7961991年·Zbl 0725.62037号 ·doi:10.1214/aos/1176348120
[61] W.Härdle、S.Huet和E.Jolivet。回归曲线估计的更好的bootstrap置信区间。,《统计学:理论与应用统计学杂志》,26(4):287-3061995·Zbl 0836.62031号 ·doi:10.1080/02331889508802498
[62] W.Härdle、S.Huet、E.Mammen和S.Sperlich。半参数广义可加模型中的Bootstrap推理。,计量经济学理论,20(02):265-3002004·Zbl 1072.62034号 ·doi:10.1017/S0266466604202X
[63] D.W.Hogg、M.R.Blanton、D.J.Eisenstein、J.E.Gunn、D.J.Schlegel、I.Zehavi、N.A.Bahcall、J.Brinkmann、I.Csabai、D.P.Schneider等人。星系环境的超密度与光度和颜色的关系。,《天体物理学杂志快报》,585(1):L52003。
[64] A.Javanmard和A.Montanari.高维回归的置信区间和假设检验。,机器学习研究杂志,15(1):2869-29092014·Zbl 1319.62145号
[65] K.Jisu、Y.-C.Chen、S.Balakrishnan、A.Rinaldo和L.Wasserman。聚类树的统计推断。《神经信息处理系统进展》,第1831-1839页,2016年。
[66] E.Kong、O.Linton和Y.Xia。m-回归局部多项式估计的一致Bahadur表示及其在可加模型中的应用。,计量经济学理论,26(05):1529-15642010·Zbl 1198.62030号 ·doi:10.1017/S02664666099990661
[67] T.Laloe和R.Servien。回归水平集的非参数估计。,《韩国统计学会杂志》,2013年·兹比尔1294.62064 ·doi:10.1016/j.jkss.2012.10.001
[68] I.拉瓦尼尼和F.马格诺。单变量校准、逆回归和检测限的统计概述:气相色谱/质谱技术的应用。,质谱学评论,26(1):1-182007。
[69] Q.Li和J.Racine。交叉验证局部线性非参数回归。,《中国统计》,第485-512页,2004年·兹比尔1045.62033
[70] C.装载机。局部回归、似然和密度估计。r软件包版本1.5-9.1.,Merck,Kenilworth,NJ:http://CRAN.R-project.org/package=locfit, 2013.
[71] 马云(Y.Ma)和周晓红(X.-H.Zhou)。通过协变量特异性治疗效应曲线进行随机临床试验的治疗选择。,医学研究中的统计方法,第0962280214541724页,2014年。
[72] E.Mammen和W.Polonik。水平集的置信区域。,《多变量分析杂志》,122:202-2142013·Zbl 1280.62056号 ·doi:10.1016/j.jmva.2013.07.017
[73] J.S.Marron和M.P.Wand。精确平均积分平方误差。,《统计年鉴》,第712-736页,1992年·Zbl 0746.62040号 ·doi:10.1214/aos/1176348653
[74] E.A.纳达拉亚。关于估计回归。,概率论及其应用,9(1):141-1421964。
[75] M.H.纽曼。非参数回归中的自动带宽选择和置信区间。,《统计年鉴》,23(6):1937-19591995·兹比尔0856.62042 ·doi:10.1214/aos/1034713641
[76] M.H.Neumann和J.Polzehl。非参数回归中的同步bootstrap置信带。,非参数统计杂志,9(4):307-3331998·Zbl 0913.62041号 ·网址:10.1080/10485259808832748
[77] N.Padmanabhan、D.J.Schlegel、D.P.Finkbeiner、J.Barentine、M.R.Blanton、H.J.Brewington、J.E.Gunn、M.Harvanek、D.W.Hogg、。Ivezić等人,斯隆数字巡天成像数据的改进光度校准。,《天体物理学杂志》,674(2):12172008。
[78] W·波洛尼克。测量质量浓度和估算密度轮廓簇——过剩质量方法。,《统计年鉴》,第855-8811995页·Zbl 0841.62045号 ·doi:10.1214/aos/1176324626
[79] 乔西。密度水平集非参数估计的渐近性与最优带宽选择。,arXiv预印arXiv:1707.096972017。
[80] A.Rinaldo、A.Singh、R.Nugent和L.Wasserman。基于密度聚类的稳定性,机器学习研究杂志,13(1):905-9482012·Zbl 1283.62130号
[81] J.P.罗马诺。引导模式。,统计数学研究所年鉴,40(3):565-5861988·Zbl 0684.62039号 ·doi:10.1007/BF000053066
[82] S.R.Sain、K.A.Baggerly和D.W.Scott。多元密度的交叉验证。,《美国统计协会杂志》,89(427):807-8171994年·Zbl 0805.62059号 ·doi:10.1080/01621459.1994.10476814
[83] D.W.Scott。,多元密度估计:理论、实践和可视化。John Wiley&Sons,2015年·Zbl 1311.62004号
[84] S.Sheather和C.Jones。一种可靠的基于数据的核密度估计带宽选择方法。,《皇家统计学会杂志:B辑(统计方法)》,53(3):683-6901991年·兹比尔0800.62219 ·doi:10.1111/j.2517-6161.1991.tb01857.x
[85] S.J.护套。密度估算。,统计科学,19(4):588-5972004·Zbl 1100.62558号 ·doi:10.1214/08834230400000297
[86] B.W.Silverman。,统计和数据分析的密度估计。查普曼和霍尔,1986年·Zbl 0617.62042号
[87] J.Sun,C.R.Loader,et al.线性回归和平滑的同时置信带。,《统计年鉴》,22(3):1328-13451994年·兹伯利0817.62057 ·doi:10.1214/aos/1176325631
[88] R.Tang、M.Banerjee和G.Michailidis。估计逆回归函数的两阶段混合方法。,《统计年鉴》,39(2):956-9892011·Zbl 1215.62044号 ·doi:10.1214/10-AOS820
[89] C.Tortora、N.Napolitano、V.Cardone、M.Capaccioli、P.Jetzer和R.Molinaro。星系中的颜色和恒星数量梯度:与质量的关系,《皇家天文学会月刊》,407(1):144-1622010年。
[90] A.B.茨巴科夫。关于密度水平集的非参数估计。,《统计年鉴》,25(3):948-9691997年·Zbl 0881.62039号 ·doi:10.1214/aos/1069362732
[91] S.Van de Geer、P.Bühlmann、Y.Ritov和R.Dezeure。关于高维模型的渐近最优置信域和检验。,《统计年鉴》,42(3):1166-1202,2014年·兹比尔1305.62259 ·doi:10.1214/14-AOS1221
[92] A.van der Vaart和J.A.Wellner。,弱收敛和经验过程。施普林格,1996年·Zbl 0862.60002号
[93] L.Wasserman。,所有非参数统计。Springer-Verlag纽约公司,2006年·Zbl 1099.62029号
[94] L.Wasserman先生。拓扑数据分析。,《统计及其应用年鉴》,5:501-5322018年。
[95] S.Weisberg,《应用线性回归》,第528卷。John Wiley&Sons,2005年·Zbl 1068.62077号
[96] C.吴。回归分析中的折刀法、自举法和其他重采样方法。,统计年鉴,14(4):1261-12951986·Zbl 0618.62072号 ·doi:10.1214/aos/1176350142
[97] Y.Xia。非参数回归中的偏差校正置信带。,英国皇家统计学会杂志:B辑(统计方法),60(4):797-8111998·Zbl 0909.62043号 ·doi:10.1111/1467-9868.00155
[98] Y.Xia和W.Li。通过局部多项式拟合的交叉验证方法选择的带宽的渐近行为。,多元分析杂志,83(2):265-2872002·Zbl 1025.62016号 ·doi:10.1006/jmva.2001.2048
[99] D.G.York、J.Adelman、J.E.Anderson Jr、S.F.Anderson、J.Annis、N.A.Bahcall、J.Bakken、R.Barkhouser、S.Bastian、E.Berman等人。斯隆数字天空测量:技术总结。,《天文学杂志》,120(3):15792000。
[100] C.-H.Zhang和S.S.Zhang。高维线性模型中低维参数的置信区间。,英国皇家统计学会杂志:B辑(统计方法),76(1):217-2422014·Zbl 1411.62196号 ·doi:10.1111/rssb.12026
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。