×

纵向研究中的磨损处理:刷新样本的情况。 (英语) Zbl 1331.62135号

小结:小组研究通常会遭受损耗,这会减少样本量,并可能导致有偏见的推断。仅从观察到的面板数据就不可能知道损耗是否会导致偏差。茶点样本——新的、随机抽样的被调查者,在随后的小组讨论的同时给出了问卷——提供了可用于诊断和调整因磨损而产生的偏见的信息。我们审查并支持在小组研究中使用茶点样品的案例。我们包括两个例子,一个是用于分析串联面板和刷新数据的完全贝叶斯方法,另一个是仅用于分析原始面板的多重插补方法。对于后者,我们在通常的多重插补方差估计中记录了正偏差。我们提出了适用于三个波和两个刷新样本的模型,包括非终端损耗。我们使用2007-2008年美联社的Yahoo!新闻选举投票。

MSC公司:

2015年1月62日 贝叶斯推断
62D05型 抽样理论、抽样调查
62J12型 广义线性模型(逻辑模型)
62-07 数据分析(统计)(MSC2010)

软件:

老鼠
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Ahern,K.和Le Brocque,R.(2005年)。损耗效应中的方法学问题:社会科学家的简单解决方案。现场方法17 53-69。
[2] Barnard,J.和Meng,X.L.(1999)。多重插补在医学研究中的应用:从艾滋病到NHANES。统计方法医学研究8 17-36。
[3] Barnard,J.和Rubin,D.B.(1999年)。具有多重插补的小样本自由度。生物特征86 948-955·Zbl 0942.62025号 ·doi:10.1093/biomet/86.4.948
[4] Bartels,L.(1993)。收到的信息:媒体曝光的政治影响。《美国政治科学评论》88 267-285。
[5] Bartels,L.(1999)。美国国家选举研究中的小组效应。政治分析8 1-20。
[6] Basic,E.和Rendtel,U.(2007年)。评估德国小额信贷小组中因住宅搬家者未覆盖而产生的偏见:使用社会经济小组的数据进行的评估。AStA高级统计分析。91 311-334. ·Zbl 1405.62237号 ·doi:10.1007/s10182-007-0030-5
[7] Behr,A.、Bellgardt,E.和Rendtel,U.(2005年)。欧洲共同体家庭小组中小组人员流失的程度和决定因素。《欧洲社会学评论》23 81-97。
[8] Bhattacharya,D.(2008)。面板数据模型中因不可观察因素引起的损耗推断。《计量经济学杂志》144 430-446·Zbl 1418.62106号 ·doi:10.1016/j.jeconom.2008.03.002
[9] Burgette,L.F.和Reiter,J.P.(2010年)。通过序列回归树对缺失数据进行多重插补。美国流行病学杂志。172 1070-1076.
[10] Chen,H.Y.和Little,R.(1999)。对具有缺失数据的广义估计方程进行完全随机缺失的测试。生物特征86 1-13·Zbl 1101.62314号 ·doi:10.1093/biomet/86.1.1
[11] Chen,B.、Yi,G.Y.和Cook,R.J.(2010)。随机缺失的纵向响应和协变量数据的加权广义估计函数。J.Amer。统计人员。协会105 336-353·Zbl 1397.62368号 ·doi:10.1198/jasa.2010.tm08551
[12] Clinton,J.(2001)。来自消耗和条件作用的小组偏见:知识网络小组的案例研究。范德比尔特大学未出版的手稿,网址:。
[13] Daniels,M.J.和Hogan,J.W.(2008)。纵向研究中的缺失数据:贝叶斯建模和敏感性分析策略。统计学和应用概率专著109。查普曼和霍尔/CRC,佛罗里达州博卡拉顿·Zbl 1165.62023号
[14] Das,M.(2004)。具有样本损耗的非参数面板数据模型的简单估计。《计量经济学杂志》120 159-180·Zbl 1282.62072号 ·doi:10.1016/S0304-4076(03)00210-0
[15] 邓毅(2012)。使用多个刷新样本对面板研究中缺失的数据进行建模。北卡罗来纳州达勒姆杜克大学统计科学系硕士论文。
[16] Diggle,P.(1989)。测试重复测量数据中的随机缺失。生物计量学45 1255-1258。
[17] Diggle,P.J.、Heagerty,P.J、Liang,K.-Y.和Zeger,S.L.(2002)。纵向数据分析,第二版,牛津统计科学系列25。牛津大学出版社,牛津·Zbl 1031.62002号
[18] Dorsett,R.(2010)。使用倾向得分匹配确定的调查替代品调整不可忽视的样本损耗:一项使用劳动力市场数据的实证调查。官方统计杂志26 105-125。
[19] Fitzgerald,J.、Gottschalk,P.和Moffitt,R.(1998)。对小组数据中样本流失的分析:密歇根州收入动态小组研究。人力资源杂志33 251-299。
[20] Fitzmaurice,G.M.、Laird,N.M.和Ware,J.H.(2004)。应用纵向分析。新泽西州霍博肯威利·Zbl 1057.62052号
[21] Frick,J.R.、Goebel,J.、Schechtman,E.、Wagner,G.G.和Yitzhaki,S.(2006)。使用基尼分析(ANOGI)检测两个子样本是否代表同一个宇宙。社会学。方法研究34 427-468。
[22] Gelman,A.(2007)。努力进行调查加权和回归建模。统计人员。科学。22 153-164. ·Zbl 1246.62043号 ·doi:10.1214/0883423060000000691
[23] Gelman,A.、Meng,X.-L.和Stern,H.(1996)。通过实现差异对模型适合性进行后验预测评估(讨论)。统计人员。中研院6 733-807·Zbl 0859.62028号
[24] Hausman,J.和Wise,D.(1979年)。实验数据和面板数据中的损耗偏差:加里收入维持实验。《计量经济学》47 455-473。
[25] He,Y.,Zaslavsky,A.M.,Landrum,M.B.,Harrington,D.P.和Catalano,P.(2010)。大规模复杂调查中的多重插补:实用指南。统计方法医学研究19 653-670·doi:10.1177/0962280208101273
[26] Hedeker,D.和Gibbons,R.D.(2006年)。纵向数据分析。新泽西州霍博肯威利·兹比尔1136.62075 ·数字对象标识代码:10.1002/0470036486
[27] Heeringa,S.(1997)。俄罗斯纵向监测调查样本消耗、补充和加权:第V-VII轮。密歇根大学社会研究所。
[28] Henderson,M.、Hillygus,D.和Tompson,T.(2010年)。“酸葡萄”还是理性投票?2008年初选失利选民的投票决策。《民意季刊》74 499-529。
[29] Hirano,K.、Imbens,G.、Ridder,G.和Rubin,D.(1998年)。将面板数据集与损耗和更新样本相结合。NBER工作文件230·Zbl 1019.91037号 ·doi:10.111/1468-0262.00260
[30] Hirano,K.、Imbens,G.W.、Ridder,G.和Rubin,D.B.(2001年)。将面板数据集与损耗和更新样本相结合。《计量经济学》69 1645-1659·Zbl 1019.91037号 ·doi:10.1111/1468-0262.00260
[31] Honaker,J.和King,G.(2010年)。如何处理时间序列横截面数据中的缺失值。美国政治科学杂志54 561-581。
[32] Jelicić,H.、Phelps,E.和Lerner,R.M.(2009年)。纵向研究中缺失数据方法的使用:发展心理学中不良行为的持续存在。发展心理学。45 1195-1199.
[33] Kalton,G.和Kasprzyk,D.(1986年)。缺失调查数据的处理。调查方法12 1-16。
[34] Kenward,M.G.(1998年)。非随机丢失重复测量的选择模型:灵敏度说明。《Stat.Med.17 2723-2732》。
[35] Kenward,M.G.、Molenberghs,G.和Thijs,H.(2003)。具有适当时间依赖性的模式混合模型。生物特征90 53-71·Zbl 1035.62112号 ·doi:10.1093/biomet/90.1.53
[36] Kish,L.和Hess,I.(1959年)。一种减少无应答偏倚的“替代”程序。阿默尔。统计人员。13 17-19. ·doi:10.1198/000313004X6300
[37] Kristman,V.、Manno,M.和Cote,P.(2005年)。解释纵向数据中损耗的方法:它们有效吗?模拟研究。欧洲流行病学杂志20 657-662。
[38] Kruse,Y.、Callegaro,M.、Dennis,J.、Subias,S.、Lawrence,M.,DiSogra,C.和Tompson,T.(2009年)。AP-Yahoo!中的面板调节和损耗!新闻选举小组研究。在佛罗里达州好莱坞举行的美国民意研究协会(AAPOR)第64届会议上。
[39] Lawless,J.(2009)。2008年大选中的性别歧视和性别偏见:女性参政的一条更为复杂的道路。政治性别5 70-80。
[40] Li,K.H.、Raghunathan,T.E.和Rubin,D.B.(1991年)。使用基于矩的统计和(F)参考分布的多重插补数据的大样本显著性水平。J.Amer。统计人员。协会86 1065-1073。
[41] Li,K.H.,Meng,X.-L.,Raghunathan,T.E.和Rubin,D.B.(1991)。多重插补数据的重复(p)值的显著性水平。统计人员。Sinica 1 65-92号·Zbl 0823.62009
[42] Lin,H.、McCulloch,C.E.和Rosenheck,R.A.(2004)。纵向研究中信息性间歇性缺失数据的潜在模式混合模型。生物统计学60 295-305·Zbl 1132.62362号 ·doi:10.1111/j.0006-341X.2004.00173.x
[43] Lin,I.和Schaeffer,N.C.(1995年)。使用调查参与者评估不参与的影响。《民意季刊》59 236-258。
[44] Little,R.J.A.(1993年)。多元不完全数据的模式混合模型。J.Amer。统计人员。协会88 125-134·Zbl 0775.62134号 ·doi:10.2307/2290705
[45] Little,R.J.A.和Rubin,D.B.(2002年)。《缺失数据的统计分析》,第二版,新泽西州霍博肯威利出版社·Zbl 1011.62004号
[46] Lohr,S.(1998)。取样:设计和分析。科尔出版公司,伦敦·Zbl 0967.62005年
[47] Lynn,P.(2009)。纵向测量方法。英国奇切斯特威利。
[48] 孟晓乐(1994)。后验预测值。安。统计师。22 1142-1160. ·Zbl 0820.62027号 ·doi:10.1214/aos/1176325622
[49] Meng,X.-L.和Rubin,D.B.(1992年)。使用多重插补数据集进行似然比测试。生物特征79 103-111·Zbl 0754.62041号 ·doi:10.1093/biomet/79.1.103
[50] Molenberghs,G.、Beunckens,C.、Sotto,C.和Kenward,M.G.(2008年)。非随机模型中的每一个缺失都有一个相同拟合度的随机对应体中的缺失。J.R.统计社会服务。B Stat.方法。70 371-388. ·Zbl 1148.62046号 ·doi:10.1111/j.1467-9868.2007.00640.x
[51] Nevo,A.(2003年)。当辅助信息可用时,使用权重调整样本选择。J.总线。经济。统计人员。21 43-52.
[52] Olsen,R.(2005)。受访者流失问题:调查方法是关键。每月劳工审查128 63-71。
[53] Olson,K.和Witt,L.(2011)。我们留住了以前留下来的人吗?随着时间的推移,小组调查人员流失的相关因素发生了变化。社会科学研究40 1037-1050。
[54] Packer,M.、Colucci,W.、Sackner Bernstein,J.、Liang,C.、Goldscher,D.、Freeman,I.、Kukin,M.、Kinhal,V.、Udelson,J.、Klapholz,M.等人(1996)。卡维地洛对中重度心力衰竭患者疗效的双盲、安慰剂对照研究:PRECISE试验。循环94 2800-2806。
[55] Pasek,J.、Tahk,A.、Lelkes,Y.、Krosnick,J、Payne,B.、Akhtar,O.和Tompson,T.(2009)。2008年美国总统大选投票率和候选人选择的决定因素:阐明种族偏见和其他因素的影响。《民意季刊》73 943-994。
[56] 皮尤研究中心(2010)。四年后,共和党人与男性、白人、无党派人士和老年人相处得更好(新闻稿)。可从获取。
[57] Prior,M.(2010)。你要么有,要么没有?政治利益在生命周期中的稳定性。《政治杂志》72 747-766。
[58] 曲A和宋P.X.K.(2002)。测试纵向数据估算方程方法中的可忽略遗漏。生物特征89 841-850·Zbl 1107.62327号 ·doi:10.1093/biomet/89.4.841
[59] 瞿A.、易G.Y.、宋P.X.K.和王P.(2011)。评估加权广义估计方程的有效性。生物特征98 215-224·Zbl 1437.62587号 ·doi:10.1093/biomet/asq078
[60] Raghunathan,T.E.、Lepkowski,J.M.、van Hoewyk,J.和Solenberger,P.(2001)。使用一系列回归模型进行多重输入缺失值的多元技术。调查方法27 85-96。
[61] Reiter,J.P.(2007年)。缺失数据多重插补的多成分显著性检验的小样本自由度。生物特征94 502-508·Zbl 1132.62030 ·doi:10.1093/biomet/asm028
[62] Reiter,J.P.(2008)。用于插补的记录未用于分析或传播时的多重插补。生物特征95 933-946·Zbl 1437.62590号 ·doi:10.1093/biomet/asn042
[63] Reiter,J.P.和Raghunathan,T.E.(2007年)。多重插补的多重适应。J.Amer。统计人员。协会102 1462-1471·Zbl 1332.62044号 ·doi:10.1198/0162145000000932
[64] Ridder,G.(1992年)。面板数据中一些非随机损耗模型的实证评估。结构变化与经济动态3 337-355。
[65] Robins,J.M.和Rotnitzky,A.(1995年)。缺失数据多元回归模型的半参数效率。J.Amer。统计人员。协会90 122-129·Zbl 0818.62043号 ·doi:10.2307/2291135
[66] Robins,J.M.、Rotnitzky,A.和Zhao,L.P.(1995)。缺失数据下重复结果的半参数回归模型分析。J.Amer。统计人员。协会90 106-121·Zbl 0818.62042号 ·doi:10.2307/2291134
[67] Rotnitzky,A.、Robins,J.M.和Scharfstein,D.O.(1998)。不可忽视无反应重复结果的半参数回归。J.Amer。统计人员。协会93 1321-1339·Zbl 1064.62520号 ·doi:10.2307/2670049
[68] Roy,J.(2003)。使用潜在辍学类别模型对具有不可忽视辍学的纵向数据进行建模。生物统计学59 829-836·Zbl 1218.62117号 ·doi:10.1111/j.0006-341X.2003.0097.x
[69] 罗伊·J和丹尼尔斯·M·J(2008年)。一类具有许多可能的丢失时间的不可忽略丢失的模式混合模型。生物计量学64 538-545668·Zbl 1137.62016年 ·doi:10.1111/j.1541-0420.2007.00884.x
[70] Rubin,D.B.(1976年)。推断和缺失数据(讨论)。生物特征63 581-592·Zbl 0344.62034号 ·doi:10.1093/生物技术/63.3581
[71] Rubin,D.B.(1987)。调查中无应答的多重插补。纽约威利·2007年6月10日
[72] Rubin,D.B.(1996)。18年以上的多重插补。J.Amer。统计人员。协会91 473-489·Zbl 0869.62014年 ·doi:10.2307/2291635
[73] Rubin,D.B.(2003)。通过部分不相容MCMC对NMES进行嵌套多重插补。Stat.尼尔尔。57 3-18. ·doi:10.1111/1467-9574.00217
[74] Rubin,D.和Zanutto,E.(2001年)。使用匹配的替代物通过多重插补来调整不可忽视的无应答。《调查中无回应》(R.Groves、D.Dillman、R.Little和J.Eltinge编辑)389-402。纽约威利。
[75] Schafer,J.L.(1997)。不完全多元数据分析。统计学和应用概率专著72。查普曼和霍尔,伦敦·Zbl 0997.62510号
[76] Scharfstein,D.O.、Rotnitzky,A.和Robins,J.M.(1999年)。使用半参数无响应模型调整不可忽视的退出。J.Amer。统计人员。协会94 1096-1120·Zbl 1072.62644号 ·doi:10.2307/2669923
[77] Semykina,A.和Wooldridge,J.M.(2010年)。在存在内生性和选择的情况下估计面板数据模型。《计量经济学杂志》157 375-380·Zbl 1431.62667号 ·doi:10.1016/j.jeconom.2010.03.039
[78] 沈政(2000)。嵌套多重插补。哈佛大学统计系博士论文。
[79] Siddique,J.、Harel,O.和Crespi,C.M.(2012年)。使用多重插补解决缺失数据机制的不确定性:应用于纵向临床试验。附录申请。统计数据6 1814-1837·Zbl 1257.62113号 ·doi:10.1214/12-AOAS555
[80] Siddiqui,O.、Flay,B.和Hu,F.(1996)。纵向吸烟预防研究中影响消耗的因素。预防医学25 554-560。
[81] Thompson,M.、Fong,G.、Hammond,D.、Boudreau,C.、Driezen,P.、Hyland,A.、Borland,R.、Cummings,K.、Hastings,G.和Siahpush,M.等人(2006年)。国际烟草控制(ITC)四国调查方法。烟草控制15补遗3。
[82] Traugott,M.和Tucker,C.(1984年)。预测公民是否投票的策略和选举结果的估计。《民意季刊》48 330-343。
[83] Van Buuren,S.和Oudshoorn,C.(1999)。MICE的灵活多变量插补。技术报告TNO/VGZ/PG 99.054,TNO Preventie en Gezondheid,Leiden。
[84] Vandecasteel,L.和Debels,A.(2007年)。面板数据中的损耗:权重的有效性。《欧洲社会学评论》23 81-97。
[85] Vehovar,V.(1999)。现场替换和单位无响应。官方统计杂志15 335-350。
[86] Vella,F.和Verbeek,M.(1999)。具有删失内生变量和选择偏差的面板数据模型的两步估计。计量经济学杂志90 239-263·Zbl 0933.62127号 ·doi:10.1016/S0304-4076(98)00043-8
[87] Verbeke,G.和Molenberghs,G.(2000年)。纵向数据的线性混合效应模型。柏林施普林格·Zbl 0900.62374号 ·doi:10.1016/S0167-9473(96)00047-3
[88] Wawro,G.(2002)。估计政治学中的动态面板数据模型。政治分析10 25-48。
[89] Wissen,L.和Meurs,H.(1989)。荷兰流动小组:经验与评估。运输16 99-119。
[90] Wooldridge,J.M.(2005)。具有不可观测异质性的动态非线性面板数据模型中初始条件问题的简单解决方案。J.应用。计量经济学20 39-54·doi:10.1002/jae.770
[91] Zabel,J.(1998)。收入动态小组研究和收入与项目参与调查中的消耗分析,并应用于劳动力市场行为模型。人力资源杂志33 479-506。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。