×

使用局部加权最小绝对偏差回归对导数进行稳健估计。 (英语) Zbl 1489.62131号

摘要:在非参数回归中,导数估计由于其广泛的应用,近年来受到了广泛的关注。在本文中,我们提出了一种使用局部加权最小绝对偏差回归进行导数估计的新方法。与局部多项式回归不同,该方法不需要误差项的有限方差,因此对存在重尾误差具有鲁棒性。同时,与局部中值回归相比,它不需要误差项的零中值或零处的正密度。我们进一步证明了所提出的随机差分估计量与(无限)复合分位数回归估计量渐近等价。换句话说,运行一个回归相当于组合无限多个分位数回归。此外,该方法还被推广到边界导数的估计和高阶导数的估计。对于等距设计,我们导出了所提出的估计量的理论结果,包括渐近偏差和方差、一致性和渐近正态性。最后,我们进行了仿真研究,以证明该方法在存在离群值和重尾误差的情况下比现有方法具有更好的性能,并分析了中国过去十年的房价数据,以说明该方法的有效性。

MSC公司:

62克08 非参数回归和分位数回归
62G05型 非参数估计
62G35型 非参数稳健性
62第20页 统计学在经济学中的应用
PDF格式BibTeX公司 XML格式引用
全文: 链接

参考文献:

[1] G.Boente和D.Rodriguez。回归函数高阶导数的稳健估计。统计与概率快报,76(13):1335-13442006·Zbl 1094.62049号
[2] L.D.Brown和M.Levine。非参数回归中基于差分序列法的方差估计。《统计年鉴》,35(5):2219-22322007·Zbl 1126.62024号
[3] J.L.O.卡布雷拉。locpol:核局部多项式回归。R包版本0.6-02012。统一资源定位地址http://mirrors.ustc.edu.cn/CRAN/web/packages/locpol/index.html。
[4] R.Charnigo、M.Francoeur、M.P.Meng–c、A.Brock、M.Leichter和c.Srinivasan。散射剖面导数:纳米颗粒表征工具。美国光学学会杂志,24(9):2578-25892007。
[5] R.Charnigo、M.Francoeur、M.P.Meng–c、B.Hall和c.Srinivasan。使用散射剖面的多个导数估计纳米粒子的定量特征。定量光谱学与辐射转移杂志,112(8):1369-13822011a。
[6] R.Charnigo、B.Hall和C.Srinivasan。导数估计的广义Cp准则。技术计量学,53(3):238-2532011b。
[7] P.Chaudhuri和J.S.Marron。曲线结构勘探的SiZer。美国统计协会期刊,94(447):807-8231999·Zbl 1072.62556号
[8] W.S.克利夫兰。稳健的局部加权回归和平滑散点图。《美国统计协会杂志》,74(368):829-8361979年·Zbl 0423.62029号
[9] K.De Brabanter、J.De Brabanter、B.De Moor和I.Gijbels。局部多项式拟合的导数估计。机器学习研究杂志,14(1):281-3012013·Zbl 1320.62088号
[10] M.Delecroix和A.C.Rosa。遍历假设下回归函数及其导数的非参数估计。非参数统计杂志,6(4):367-3821996·Zbl 0879.62034号
[11] N.R.Draper和H.Smith。应用回归分析。威利父子公司,纽约,第二版,1981年·Zbl 0548.62046号
[12] J.Fan和I.Gijbels。局部多项式建模及其应用。查普曼和霍尔出版社,伦敦,1996年·Zbl 0873.62037号
[13] J.Fan和P.Hall。通过最小化平均绝对偏差进行曲线估计及其含义。《统计年鉴》,22(2):867-8851994年·Zbl 0806.62030号
[14] S.Ghosal、A.Sen和A.W.vander Vaart。测试回归的单调性。《统计年鉴》,28(4):1054-10822000·Zbl 1105.62337号
[15] I.Gijbels和A.C.Goderniaux。回归函数导数中的数据驱动不连续性检测。统计学传播——理论与方法,33(4):851-8712005·兹比尔1218.62031
[16] B.霍尔。导数的非参数估计及其应用。2010年,肯塔基州列克星敦肯塔基大学博士论文。
[17] W.H–ardle公司。应用非参数回归。剑桥大学出版社,剑桥,1990年·Zbl 0714.62030号
[18] W.H¨ardle和T.Gasser。稳健的非参数函数拟合。英国皇家统计学会杂志,B辑,46(1):42-511984·Zbl 0543.62034号
[19] W.H¨ardle和T.Gasser。回归函数导数的稳健核估计。《斯堪的纳维亚统计杂志》,12(3):233-2401985年·Zbl 0568.62041号
[20] P.J.Huber和E.M.Ronchetti。稳健统计。John Wiley&Sons,Inc.,2009年·Zbl 1276.62022号
[21] B.Kai、R.Li和H.Zou。局部复合分位数回归平滑:局部多项式回归的一种有效且安全的替代方法。英国皇家统计学会杂志,B辑,72(1):49-692010·Zbl 1411.62101号
[22] G.D.诺特。插值三次样条曲线。2000年春季,第1版·Zbl 1057.41001号
[23] R.Koenker。关于线性模型l-估计的注记。《统计与概率快报》,2(6):323-3251984年·兹比尔062662029
[24] R.Koenker。分位数回归。剑桥大学出版社,纽约,2005年·Zbl 1111.62037号
[25] R.Koenker和G.Bassett。回归分位数。《计量经济学》,46(1):33-501978年·Zbl 0373.62038号
[26] X.R.Li和V.P.Jilkov。机动目标跟踪综述。第一部分:动态模型。IEEE航空航天和电子系统交易,39(4):1333-13642003。
[27] X.R.Li和V.P.Jilkov。机动目标跟踪综述。第二部分:弹道和空间目标的运动模型。IEEE航空航天和电子系统交易,46(1):96-1192010。
[28] Y.Liu和K.De Brabanter。随机设计中的导数估计。第32届神经信息处理系统会议(NeurIPS 2018),加拿大蒙特利尔。,2018
[29] 一、马特亚索夫斯基。检测不同时间尺度上的气候突变。理论与应用气候学,105(3-4):445-4542011。
[30] H.G.M¨uller公司。纵向数据的非参数回归分析。施普林格,纽约,1988年·Zbl 0664.62031号
[31] H.G.Müuller、U.Stadtmüuller和T.Schmitt。噪声数据导数的带宽选择和置信区间。《生物统计学》,74(4):743-7491987年·Zbl 0628.62034号
[32] J.Newell、J.Einbeck、N.Madden和K.McMillan。基于血乳酸曲线二阶导数的无模型耐力标记。《第20届统计建模国际研讨会论文集》,第357-364页,悉尼,2005年。
[33] F.Osorio。L1pack:L1估算程序。R包版本0.32015。网址:http://www.ies.ucv.cl/l1pack/。
[34] A.Pakes和D.Pollard。仿真和优化估计的渐近性。《计量经济学》,57(5):1027-10571989年·Zbl 0698.62031号
[35] C.Park和K.H Kang。回归曲线比较的SiZer分析。计算统计与数据分析,52(8):3954-39702008·Zbl 1452.62291号
[36] J.Porter和P.Yu。具有未知间断点的回归间断设计:测试和估计。《计量经济学杂志》,189(1):132-1472015·Zbl 1337.62082号
[37] J.Ramsay和B.Ripley。pspline:惩罚平滑样条线。R包版本1.0-162013。统一资源定位地址http://mirrors.ustc.edu.cn/CRAN/web/packages/pspline/index.html。
[38] J.O.拉姆齐和B.W.西尔弗曼。应用功能数据分析:方法和案例研究。施普林格,纽约,2002年·Zbl 1011.62002号
[39] D.Ruppert和M.P.Wand。多元局部加权最小二乘回归。《统计年鉴》,22(3):1346-13701994年·Zbl 0821.62020号
[40] C.J.斯通。加性回归和其他非参数模型。《统计年鉴》,13(2):689-7051985·Zbl 0605.62065号
[41] P.S.Swain、K.Stevenson、A.Leary、L.F.Montano-Gutierrez、I.B.N.Clark、J.Vogel和T.Pilizota。使用高斯过程推断包括细胞生长率在内的时间导数。《自然通讯》,7:137662016年。
[42] G.Wahba和Y.Wang。最佳正则化参数何时对损失函数的选择不敏感?统计学中的传播——理论和方法,19(5):1685-17001990·Zbl 0724.62044号
[43] F.T.Wang和D.W.Scott。稳健非参数回归的L1方法。《美国统计协会杂志》,89(425):65-761994年·Zbl 0791.62044号
[44] W.W.Wang和L.Lin.基于差分序列的局部加权最小二乘回归导数估计。《机器学习研究杂志》,16:2617-26412015·Zbl 1351.62095号
[45] W.W.Wang和P.Yu。非参数回归中误差方差的渐近最优差分估计。计算统计与数据分析,105:125-1432017·Zbl 1466.62212号
[46] A.H.威尔士。平滑回归和扩散函数及其导数的稳健估计。中国统计,6(2):347-3661996·Zbl 0884.62047号
[47] Z.Zhao和Z.Xiao。通过优化组合分位数信息实现高效回归。计量经济学理论,30(6):1272-13142014·Zbl 1314.62151号
[48] S.Zhou和D.A.Wolfe。样条回归中的导数估计。中国统计,10(1):93-1082000·兹比尔0970.62024
[49] H.Zou和M.Yuan。复合分位数回归和预言模型选择理论。《统计年鉴》,36(3):1108-1126,2008年·Zbl 1360.62394号
[50] 图5:(a)-(d)基于图3模拟数据集的真实二阶导数函数(黑线)、LowLAD(绿线)和LowLSR估值器(红线)。
[51] 图6:(a)-(d)基于图4模拟数据集的真实二阶导数函数(黑线)、LowLAD(绿线)和LowLSR估值器(红线)。
[52] 图7:具有~95的函数4的四个估计量的盒图
[53] 图8:函数m4的四个估计量的箱线图(~95)
[54] 图9:黑色和绿色点分别表示北京和济南的房价。α0.0010.0020.0030.0040.0050.0060.0070.0080.009
[55] 表4:σ0的临界值等于不同污染的LowLAD(RLowLAD)和LowLSR导数估值器的方差。
[56] 图10:黑色和绿色曲线分别表示北京和济南的相对增长率。相对生长率定义为RLowLAD/P水稻。
[57] 图11:黑色和绿色曲线表示基于低阶RLowLAD估计量的相对增长率。
[58] 图12:红线是LowLSR和LowLAD之间的临界σ0曲线,i~(1-α)N(0,1)+αN(0,σ02),红色水平线是σ0=2.77;绿线是LowLSR和RLowLAD之间的临界σ0曲线,绿色水平线是σ0=1.42;黑线为σ0=1。
[59] 图13:红线是RLowLAD和LAD之间的临界σ0曲线,其误差分布与图12相同,其中大于20的比率被截断为20,绿色水平线为σ0=3.28,黑色线为∑0=1。
[60] 图14:红点曲线是不同ν的LowLSR和RLowLAD fort(ν)之间的方差比函数;绿色水平线为比率=0.95。
[61] 图15:红点曲线是不同ν的(ν)的LAD和RLowLAD估计量之间的方差比函数;绿色水平线为Ratio=1.50。
[62] 图16:红色曲线是i~0.5N(µ,1)+0.5N(−µ,l)不同µ的LowLSR和RLowLAD之间的方差比函数;绿色水平线为比率=0.89。
[63] 图17:红色曲线是图16中相同误差分布的RLowLAD和LAD之间的方差比函数;绿色水平线为Ratio=1。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。