×

大数据中消耗偏差的面板分位数方法:来自随机实验的证据。 (英语) Zbl 1452.62917号

摘要:本文介绍了具有个体异质性和损耗的面板数据模型的分位数回归估计量。该方法的动机是大数据应用程序中经常会遇到消耗偏差。例如,许多用户注册了最新的项目,但几个月后仍然活跃的用户寥寥无几,这使得对此类干预措施的评估本身就非常具有挑战性。在早期工作的基础上J.A.豪斯曼D.A.怀斯[“实验数据和面板数据中的损耗偏差:加里收入维持实验”,《计量经济学》第47卷第2期,第455-473页(1979年;doi:10.2307/1914193)],我们提供了一个简单的识别策略,导致两步估计过程。在第一步中,使用参数或非参数方法一致地估计选择方程中的感兴趣系数。在第二步中,对加权观测的子集使用标准面板分位数方法。该估计器在具有大量主题的大数据应用程序中易于实现。我们研究了参数估计量渐近高斯的条件,并进行了一系列蒙特卡罗模拟来研究估计量的有限样本性质。最后,通过一个模拟练习,我们将该方法应用于最近一次受D.J.艾格纳J.A.豪斯曼[《修正当日电价实验分析中的截断偏差》,Bell J.Econ.11,No.1,131–142(1980;doi:10.2307/3003404)].

MSC公司:

62第20页 统计学在经济学中的应用
62G05型 非参数估计
62G08号 非参数回归和分位数回归
62兰特 大数据和数据科学的统计方面

软件:

quantreg公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 阿巴迪,A。;Angrist,J。;Imbens,G.,《补贴培训对学员收入分位数影响的工具变量估计》,计量经济学,70,1,91-117(2002)·Zbl 1104.62331号
[2] Abrevaya,J。;Dahl,C.,《吸烟和产前护理对出生结局的影响:来自面板数据分位数回归估计的证据》,J.Bus。经济。统计人员。,26, 4, 379-397 (2008)
[3] 艾格纳,D.J。;Hausman,J.A.,《修正当日电价实验分析中的截断偏差》,贝尔J.经济学。,11, 1, 131-142 (1980)
[4] 阿雷拉诺,M。;Honoré,B.,第53章-面板数据模型:一些最新发展,(Heckman,J.J.;Leamer,E.,《计量经济学手册》,第5卷(2001),Elsevier),3229-3296
[5] Babcock,B。;巴布,S。;数据员,M。;莫特瓦尼,R。;Widom,J.,数据流系统中的模型和问题,第二十届ACM SIGMOD-SIGACT-SIGART数据库系统原理研讨会论文集(2002)
[6] Baltagi,B.,《面板数据的计量经济学分析》(2013),Wiley:Wiley New York
[7] 贝洛尼,A。;Chernozhukov,V.,高维稀疏模型中的(ell_1)惩罚分位数回归,Ann.Statist。,39, 1, 82-130 (2011) ·Zbl 1209.62064号
[9] Canay,I.A.,《面板数据分位数回归的简单方法》,《经济学》。J.,14,3,368-386(2011)·兹比尔1284.62258
[10] 陈,X。;Wan,A.T.K。;周,Y.,带缺失观测值的有效分位数回归分析,J.Amer。统计师。协会,110,510,723-741(2015)·Zbl 1373.62153号
[11] 切尔诺朱科夫,V。;弗南德斯·瓦尔,I。;哈恩,J。;Newey,W.,不可分割面板模型中的平均值和分位数效应,计量经济学,81535-580(2013)·Zbl 1274.62580号
[12] 切尔诺朱科夫,V。;弗南德斯·瓦尔,I。;霍德林,S。;霍尔兹曼,H。;Newey,W.,《使用分位数在面板中进行非参数识别》,《计量经济学杂志》,188,2,378-392(2015)·Zbl 1337.62050
[13] 切尔诺朱科夫,V。;Hong,H.,《三步删失分位数回归与婚外情》,J.Amer。统计师。协会,97,872-882(2002)·Zbl 1048.62112号
[14] 达戈斯蒂诺,R.B。;Rubin,D.B.,《估计和使用部分缺失数据的倾向得分》,J.Amer。统计师。协会,95,451,749-759(2000)
[16] 邓,Y。;Hillygus,D.S。;Reiter,J.P。;Si,Y。;Zheng,S.,《纵向研究中的损耗处理:以茶点样本为例》,Statist。科学。,28, 2, 238-256 (2013) ·Zbl 1331.62135号
[17] Díaz,I.,《缺失数据模型中分位数的有效估计》,J.Statist。计划。推断,190,39-51(2017)·Zbl 1376.62017年
[18] Fernandez-Val,I.,《具有个别特定参数的面板数据模型中的偏差修正》(2005),Mimeo
[19] 菲茨杰拉德,J。;Gottschalk,P。;Moffitt,R.,《面板数据中样本损耗的分析:收入动态的密歇根面板研究》,J.Hum.Res.,33,2,pp.251-299(1998)
[20] Galvao,A.F。;拉马克,C。;Lima,L.R.,固定效应面板数据的删失分位数回归估计,J.Amer。统计师。协会,108,503,1075-1089(2013)·Zbl 06224988号
[21] Gutenbrunner,C。;Jureckova,J.,回归秩分和回归分位数,Ann.Statist。,1, 305-330 (1992) ·兹伯利0759.62015
[22] 哈恩,J。;Newey,W.,《非线性面板模型的刀切和分析偏差减少》,《计量经济学》,72,4,1295-1319(2004)·Zbl 1091.62136号
[23] 哈丁,M。;Lamarche,C.,《估计和测试具有交互效应的分位数回归模型》,《计量经济学杂志》,178,第1部分,101-113(2014)·Zbl 1293.62185号
[24] 哈丁,M。;Lamarche,C.,通过数据和智能技术赋予消费者权力:关于使用时间电价政策后果的实验证据,政策分析杂志。管理。,35, 4, 906-931 (2016)
[28] Hirano,K。;Imbens,G.W。;Ridder,G。;Rubin,D.B.,《将面板数据集与损耗和刷新样本相结合》,《计量经济学》,69,6,第1645-1659页(2001年)·Zbl 1019.91037号
[29] Hofleitner,A。;Herring,R。;Bayen,A.,《使用流数据进行动脉行程时间预测:流建模和机器学习的混合方法》,交通运输。决议B,46,9,1097-1122(2012)
[30] 肖,C.,《面板数据分析》(2014),剑桥大学出版社:剑桥大学出版社,纽约·Zbl 1320.62003年
[31] 伊藤,K.,消费者会对边际价格还是平均价格做出反应?来自非线性电价的证据,Amer。经济。版本:104、2、537-563(2014)
[32] Jessoe,K。;Rapson,D.,《知识就是(更少的)力量:来自住宅能源使用的实验证据》,Amer。经济。版本:104、4、1417-1438(2014)
[33] Joskow,P.L.,《创造更智能的美国电网》,J.Econ。透视。,26, 29-48 (2012)
[34] 加藤,K。;Galvao,A.F。;Montes-Rojas,G.,《具有个体效应的面板分位数回归模型的渐近性》,《计量经济学杂志》,170,76-91(2012)·Zbl 1443.62475号
[35] K.K.Knight,《一般条件下(l_1)回归估计的极限分布》,《统计年鉴》。,26, 755-770 (1998) ·Zbl 0929.62021号
[36] K.奈特、W.傅,2000年。套索型估计的渐近性,28(5)1356-1378。;K.奈特、W.傅,2000年。套索型估计量的渐近性,28(5)1356-1378·Zbl 1105.62357号
[37] Koenker,R.,纵向数据的分位数回归,J.多元分析。,91, 74-89 (2004) ·Zbl 1051.62059号
[38] Koenker,R.,《分位数回归》(2005),剑桥大学出版社·Zbl 1111.62037号
[39] Koenker,R.,2013年。Quantreg,R包5.05版,www.R-project.org;Koenker,R.,2013年。Quantreg,R包5.05版,www.R-project.org
[40] Kyriazidou,E.,面板数据样本选择模型的估计,计量经济学,65,6,1335-1364(1997)·Zbl 0905.62121号
[41] Lamarche,C.,面板数据的稳健惩罚分位数回归估计,《计量经济学杂志》,157396-408(2010)·Zbl 1431.62161号
[42] Lipsitz,S.R。;Fitzmaurice,G.M。;Molenberghs,G。;Zhao,L.P.,《滴落物纵向数据的分位数回归方法:应用于感染人类免疫缺陷病毒患者的cd4细胞计数》,J.R.Stat.Soc.Ser。C.申请。Stat.,46,4,463-476(1997)·Zbl 0908.62114号
[43] Maitra,P。;Vahid,F.,《家庭特征对南非生活水平的影响:样本损耗的分位数回归分析》,J.Appl。计量经济学,21,7,999-1018(2006)
[44] 莫雷拉·马提亚斯,L。;ao Gama,J。;费雷拉,M。;ao Mendes-Moreira,J。;Damas,L.,《使用流媒体数据预测出租车乘客需求》,IEEE Trans。智力。运输。系统。,14, 3, 1393-1402 (2013)
[45] Nevo,A.,当辅助信息可用时,使用权重调整样本选择,J.Bus。经济。统计人员。,21, 1, 43-52 (2003)
[46] Portnoy,S.,删失回归分位数,J.Amer。统计师。协会,98,1001-1012(2003)·Zbl 1045.62099号
[47] 拉马纳森,R。;恩格尔,R。;格兰杰,C.W。;瓦希德·阿拉吉,F。;Brace,C.,电力负荷和峰值的短期预测,国际期刊预测。,13, 161-174 (1997)
[48] Ridder,G.,面板数据中非随机损耗的一些模型的经验评估,结构。改变经济。动态。,3, 2, 337-355 (1992)
[49] 罗宾斯,J.M。;Rotnitzky,A。;Zhao,L.P.,缺失数据下重复结果的半参数回归模型分析,J.Amer。统计师。协会,90429,第106-121页(1995年)·兹伯利0818.62042
[50] 罗宾斯,J。;Wang,N.,插补估计量的推断,生物特征,87,1,113(2000)·Zbl 0974.62016
[51] Rosen,A.M.,《通过短面板中的分位数限制进行集识别》,《计量经济学杂志》,166,1,127-137(2012)·兹比尔1441.62856
[52] 罗伊·J。;Lin,X.,《不可忽视辍学和缺失协变量的多变量纵向结果分析:美沙酮治疗实践的变化》,J.Amer。统计师。协会,97,40-52(2002)·Zbl 1073.62587号
[53] 鲁宾,D.B.,《推断和缺失数据》,《生物统计学》,63,3,581-592(1976)·Zbl 0344.62034号
[54] 唐,Y。;王海杰。;何,X。;Zhu,Z.,《删失分位数回归的基于子集的信息估计量》,《检验》,21635-655(2012)·Zbl 1284.62269号
[55] 王海杰。;Wang,L.,局部加权删失分位数回归,J.Amer。统计师。协会,104,487,1117-1128(2009)·Zbl 1388.62289号
[56] Wei,Y。;马云(Ma,Y.)。;Carroll,R.J.,分位数回归中的多重插补,Biometrika,99,24223(2012)·Zbl 1239.62085号
[57] Wei,Y。;Yang,Y.,随机缺失协变量的分位数回归,统计学家。Sinica,24,3,1277-1299(2014)·Zbl 06431831号
[59] Wooldridge,J.M.,一般缺失数据问题的逆概率加权估计,《计量经济学》,141,2,1281-1301(2007)·Zbl 1418.62545号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。