×

兹马思-数学第一资源

一种解决自我报告收入数据堆积问题的统计方法。(英语) Zbl 07281520
摘要:自我报告的收入信息尤其会受到有意粗化数据的影响,这被称为堆积或舍入。如果它不是完全随机发生的(通常是这样),堆积和舍入会对统计分析结果产生不利影响。传统的统计方法没有考虑这种报告偏差,因此可能产生无效的推断。我们描述了一种新的统计建模方法,它允许我们以一种适当和灵活的方式处理自我报告的累积收入数据。我们建议将堆机制和真正的底层模型结合起来建模。为了描述真实的净收入分布,我们使用零膨胀对数正态分布。通过应用启发式程序比较假设收入分配和经验分配,从数据中确定堆积点。为了确定堆积行为,我们采用了两种不同的模型:要么我们假设分段恒定的堆积概率,要么认为堆积概率随着接近堆积点而稳定增加。我们通过一些例子验证了我们的方法。为了说明所提出方法的能力,我们使用德国国家教育小组研究的收入数据进行了一个案例研究。
理学硕士:
62层30 约束条件下的参数推理
62P25页 统计学在社会科学中的应用
62层10层 点估计
62D99型 统计抽样理论及相关课题
62层25 参数公差和置信域
PDF格式 BibTeX公司 XML 引用
全文: 内政部
参考文献:
[1] H、 Y.Bar和D.R.Lillard,在回顾性报告的事件数据中解释堆积——混合模型方法,统计医学。31(2012年),第3347-3365页。数字对象标识:10.1002/sim.5419
[2] J、 比曼和格雷尼尔先生,数字偏好的存在和影响的统计检验和测量《1997年东北游憩研究研讨会论文集》,美国农业部,博尔顿兰德,纽约州,拉德诺,宾夕法尼亚州,1998年,第44-50页。
[3] H、 P.Blossfeld、H.G.Rossbach和J.V.Maurice(编辑),泽斯里夫·弗尔齐洪斯维森沙夫特(Zeitschrift für erziehongswissenschaft),第14卷特刊,VS Verlag für Sozialwissenschaften,威斯巴登,2011年。
[4] C、 G.Camarda、P.H.C.Eilers和J.Gampe,数字偏好的一般模式建模《第22届统计建模国际研讨会论文集》,巴塞罗那,加泰罗尼亚研究所,IDESCAT,巴塞罗那,2007年,第148-153页。
[5] F、 克莱门蒂和加莱门蒂,帕累托收入分配定律:德国、英国和美国的证据,英寸财富分配的经济物理学,A.Chatterjee、S.Yarlagadda和B.K.Chakrabarti编辑,斯普林格,米兰,2005年,第3-14页。
[6] J、 Drechsler和H.Kiesl,MI双重特征:多重插补以解决收入问题中的无响应和舍入误差,奥斯特。J Stat.44(2015),第59-71页。
[7] R、 D.吉尔、M.J.范德兰和J.M.罗宾斯,随机粗化:特征,猜想,反例《第一届西雅图生物统计学研讨会论文集:生存分析》,斯普林格,纽约,1997年,第255-294页·Zbl 0918.62003
[8] J、 U.Hanisch,收入问题的全面回答,Allg。统计架构。89(2005年),第39-48页。
[9] D、 F.Heitjan和D.B.Rubin,《可忽略性和粗数据》,Ann。Stat.19(1991),第2244-2253页。doi:10.1214/aos/1176348396·Zbl 0745.62004
[10] A、 Henningsen和O.Toomet,maxLik:R中的最大似然估计包,Comput。Stat.26(2011),第443-458页。doi:10.1007/s00180-010-0217-1·Zbl 1304.65039
[11] C、 Kleiber和S.Kotz,对数范数分布,英寸经济学和精算学中的统计规模分布,C.Kleiber和S.Kotz编辑,John Wiley&Sons,Inc.,霍博肯,纽约,2003年,第107-145页·Zbl 1044.62014
[12] J、 范德兰和L.Kuijvenhoven,四舍五入数据插补,荷兰统计局,海牙/海伦,2011年。
[13] T、 利奥波德,M.Raab和J.Skopek,资料手册:开始队列6-成人教育和终身学习,国家教育小组研究,班伯格,2011年。
[14] E、 S.Maynes,《最小化金融数据中的错误:可能性》,J.Amer。Stat.Assoc.63(1968),第214-227页。
[15] H、 P.米勒和L.R.佩利,1950年人口普查报告的收入和所得税申报表,英寸1950年人口普查收入数据的评价,收入与财富研究会议,编辑,普林斯顿大学出版社,普林斯顿,新泽西州,1958年,第177-204页。
[16] J、 奈尔德和米德,函数极小化的单纯形方法,计算。J、 7(1965年),第308-313页。doi:10.1093/comjnl/7.4.308·中银0229.65053
[17] R、 M.皮克林,估计胎龄的手指偏好,医学统计。11(1992年),第1225-1238页。数字标识码:10.1002/sim.4780110908
[18] T、 E.Raghunathan、J.M.Lepkowski、J.Hoewykvan和P.Solenberger,《使用一系列回归模型对缺失值进行多重插补的多元技术》,Surv。Methodol公司。27(2001年),第85-96页。
[19] J、 M.Roberts和D.D.Brewer,《离散定量分布中堆积的测量和测试》,应用杂志。Stat.28(2001),第887-896页。doi:10.1080/02664760120074960·Zbl 1154.62305
[20] D、 鲁宾,调查中无反应的多重插补,威利,纽约,1987年。
[21] N、 Torelli和U.Trivellato,《求职持续时间数据中的建模误差》,经济学杂志。59(1993年),第187-211页。电话:10.1016/0304-4076(93)90045-7
[22] S、 Van Buuren,J.P.L.Brand,C.G.M.Groothuis Oudshoorn,D.B.Rubin,《多元插补中的全条件规范》,J.Stat.Comput。模拟。76(2006年),第1049-1064页。doi:10.1080/10629360600810434·Zbl 1144.62332
[23] S、 Van Buuren和K.Groothuis Oudshoorn,小鼠:通过R,J.Stat.Softw中的链式方程进行多元插补。45(2011年),第1-67页。
[24] H、 Wang,S.Shiffman,S.D.Griffith,D.F.Heitjan,《真相与记忆:联系即时和回顾性自我报告的香烟消费》,Ann。申请。Stat.6(2012),第1689-1706页。doi:10.1214/12-AOAS557·Zbl 1257.62129
[25] D、 赖特和布雷,四舍五入数据的混合模型,J.R.Stat.Soc。爵士。D(Statistist.)52(2003年),第3-13页。14638.98美元/美元
此参考列表基于出版商或数字数学图书馆提供的信息。它的项被试探性地匹配到zbMATH标识符,并且可能包含数据转换错误。它试图尽可能准确地反映原始论文中列出的参考文献,而不要求匹配的完整性或精确性。