×

用于统计匹配和预测的带宽选择。 (英语) Zbl 1516.62046号

摘要:虽然存在许多用于估计的带宽选择器,但用于统计匹配和预测的带宽选择迄今为止几乎没有研究过。我们为数据匹配、影响评估、场景模拟或输入缺失等非参数样本外预测问题引入了一个具有计算吸引力的选择器。即使该方法是基于引导的,我们也可以导出准则函数的闭合表达式,从而避免了蒙特卡罗近似的需要。我们研究了渐近和有限样本性能。推导出的一致性、收敛速度和广泛的仿真研究表明了选择器的成功运行。通过将该方法应用于研究西班牙性别工资差距的实际数据,对该方法进行了说明。具体地说,西班牙女性的工资是根据男性的工资方程非参数预测的,同时还要考虑她们自身(即女性)的特点。观察到的工资与预测的工资之间存在重大差异,表现出严重的性别工资差距。

理学硕士:

62G05型 非参数估计
62克08 非参数回归和分位数回归
62G09号 非参数统计重采样方法

软件:

惯性矩
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 安东尼亚迪斯,A。;教皇炎。;Sapatinas,T.,功能时间序列预测的带宽选择,Stat Probab Lett,79,733-740(2009)·Zbl 1157.62065号 ·doi:10.1016/j.spl.2008.10.028
[2] Barbeito I(2020)非参数曲线估计的精确自举方法(博士论文)。科鲁尼亚大学
[3] 布劳,F。;Kahn,L.,《性别工资差距:程度、趋势和解释》,《经济学杂志》,第55期,第789-865页(2017年)·doi:10.1257/jel.20160995
[4] 曹,R。;González Manteiga,W.,回归平滑中的Bootstrap方法,非参数统计杂志,2379-388(1993)·Zbl 1360.62202号 ·doi:10.1080/10485259308832566
[5] 戴J。;Sperlich,S。;Zucchini,W.,《利用协变量预测分布的简单方法及福利和健康经济学示例》,瑞士经济统计杂志,152,49-80(2016)·doi:10.1007/BF03399422
[6] 欧盟统计局(2013)《统计匹配:基于模型的数据整合方法》。纳入:方法和工作文件,欧盟统计局,卢森堡
[7] 范,J。;Gijbels,I.,《可变带宽和局部线性回归平滑器》,《Ann Stat》,2008-2036年第20期(1992年)·兹比尔0765.62040 ·doi:10.1214/aos/1176348900
[8] Frölich,M.,匹配估计器和最佳带宽选择,统计计算,15,197-215(2005)·doi:10.1007/s11222-005-1309-6
[9] Frölich M,Sperlich S(2019)影响评估:治疗效果和因果分析。剑桥大学出版社
[10] 加尔多,JC;史密斯,J。;Black,D.,《不平衡数据下的带宽选择和治疗效果评估》,《经济与统计年鉴》,91-92189-216(2008)·doi:10.2307/27917245
[11] 哈格斯特罗姆,J。;Luna,X.,估计平均因果影响的目标平滑参数选择,计算统计,291727-1748(2014)·Zbl 1306.65064号 ·doi:10.1007/s00180-014-0515-0
[12] 新墨西哥州海德雷奇;辛德勒,A。;Sperlich,S.,《核密度估计的带宽选择方法:全自动选择器综述》,AStA Adv Stat Ana,97,403-433(2013)·Zbl 1443.62083号 ·doi:10.1007/s10182-013-0216-y
[13] Jones,MC,核密度估计中的简单边界修正,统计计算,3135-146(1993)·doi:10.1007/BF00147776
[14] 科勒,M。;辛德勒,A。;Sperlich,S.,《内核回归带宽选择方法的回顾与比较》,《国际统计评论》,第82期,第243-274页(2014年)·Zbl 1416.62216号 ·doi:10.1111/insr.12039
[15] 李,X。;Heckman,NE,局部线性外推,《非参数统计杂志》,第15期,第565-578页(2003年)·Zbl 1054.62046号 ·doi:10.1080/10485250310001605432
[16] 麦克,YP;Silverman,BW,核回归估计的弱一致性和强一致性,Zeitschrift für Wahrscheinlichkeits theore und Verwandte Gebiete,61405-415(1982)·兹伯利0495.62046 ·doi:10.1007/BF00539840
[17] Marron J(1985)核密度估计带宽问题的渐近有效解决方案。安统计13:1011-1023·Zbl 0585.62073号
[18] 道德准则,I。;Sperlich,S。;费尔南德斯·萨因茨,A。;Roca,M.,《西班牙性别工资差距趋势:半参数分析》,《劳动研究杂志》,第33期,第173-195页(2012年)·doi:10.1007/s12122-011-9124-7
[19] Rubin,DB,《调查中无应答的多重插补》(2004年),纽约:John Wiley,纽约·2007年6月10日
[20] 护套,SJ;Jones,MC,核密度估计的一种可靠的基于数据的带宽选择方法,J R Stat Soc Ser B,53,683-690(1991)·Zbl 0800.62219
[21] Silverman,BW,密度及其导数的核esitmate的弱一致性和强一致性,Ann Stat,6177-184(1978)·Zbl 0376.62024号 ·doi:10.1214/aos/1176344076
[22] 苏,YS;Gelman,A。;希尔,J。;Yajima,M.,《R中带诊断(mi)的多重插补:打开黑箱窗口》,J Stat Softw,45,1-31(2010)
[23] Tschernig,R。;Yang,L.,时间序列的非参数滞后选择,时间序列分析杂志,21,457-487(2000)·Zbl 0974.62077号 ·doi:10.1111/1467-9892.00193
[24] van Buuren S(2018)《缺失数据的灵活插补》,第2版。查普曼和霍尔/CRC·Zbl 1416.62030号
[25] Vansteelandt,S。;贝卡尔特,M。;Claeskens,G.,《关于因果推理中的模型选择和模型指定错误》,《统计方法医学研究》,21,1,7-30(2012)·Zbl 1365.62431号 ·doi:10.1177/0962280210387717
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。