×

贝叶斯潜在模式混合模型用于处理刷新样本的面板研究中的损耗。 (英语) Zbl 1454.62056号

摘要:许多小组研究收集了茶点样本——新的、随机抽样的受访者,他们在随后的小组研究中同时完成了问卷调查。通过适当的建模,可以利用这些样本来纠正由不可忽视的消耗引起的偏差推断。当小组包括许多分类调查变量时,我们提出了这样的模型。该模型依赖于贝叶斯潜在模式混合模型,其中损耗指标和调查变量通过潜在类别模型联合建模。我们允许类内的多项式概率取决于损耗指标,这比潜在类模型的标准应用提供了更多的灵活性。我们提供的仿真研究结果说明了这种灵活性的好处。我们在2007–2008年美联社/雅虎新闻选举小组研究的数据分析中,应用该模型纠正了人员流失偏见。

MSC公司:

62D05型 抽样理论、抽样调查
2015年1月62日 贝叶斯推断
62米10 统计学中的时间序列、自相关、回归等(GARCH)
第62页第25页 统计学在社会科学中的应用

软件:

调查SDaA公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bartels,L.M.(1999)。美国国家选举研究中的小组效应。政治分析。8 1-20.
[2] Bartels,B.L.、Box-Steffensmeier,J.M.、Smidt,C.D.和Smith,R.M.(2011)。美国个人层面政党认同的动态特性。选举。螺柱30 210-222。
[3] Bayarri,M.J.和Berger,J.O.(1998年)。量化数据和模型验证中的惊喜。贝叶斯统计,6(阿尔科贝尔,1998)(J.M.Bernardo、J.O.Berger、A.P.Dawid和A.F.M.Smith编辑)53-82。牛津大学出版社,纽约·兹比尔0974.62021
[4] Behr,A.、Bellgardt,E.和Rendtel,U.(2005年)。欧洲共同体家庭小组中小组人员流失的程度和决定因素。欧洲社会学。版本21 489-512。
[5] Bhattacharya,D.(2008)。面板数据模型中因不可观察因素引起的损耗推断。《计量经济学杂志》144 430-446·Zbl 1418.62106号 ·doi:10.1016/j.jeconom.2008.03.002
[6] Brehm,J.(1993)。幻影回应者。密歇根大学出版社,密歇根州安阿伯。
[7] Brown,C.H.(1990年)。防止纵向研究中非随机丢失数据。生物统计学46 143-155·Zbl 0718.62215号 ·doi:10.2307/2531637
[8] Burden,B.C.和Hillygus,D.S.(2009年)。民意测验和选举:民意形成、两极分化和总统连任。压力螺柱问题39 619-635。
[9] Burgette,L.F.和Reiter,J.P.(2010年)。通过序列回归树对缺失数据进行多重插补。美国流行病学杂志。172 1070-1076.
[10] Daniels,M.J.和Hogan,J.W.(2000年)。在信息丢失的情况下重新参数化模式混合模型以进行灵敏度分析。生物统计学56 1241-1248·兹比尔1060.62594 ·doi:10.1111/j.0006-341X.2000.01241.x
[11] Daniels,M.J.和Hogan,J.W.(2008)。纵向研究中缺少数据。查普曼和霍尔/CRC,佛罗里达州博卡拉顿·Zbl 1165.62023号 ·doi:10.1201/9781420011180
[12] Das,M.、Toepoel,V.和van Soest,A.(2011年)。面板调查中面板调节和损耗偏差的非参数测试。社会学。方法研究40 32-56。
[13] Deng,Y.、Hillygus,D.S.、Reiter,J.P.、Si,Y.和Zheng,S.(2013)。纵向研究中的磨损处理:刷新样本的情况。统计师。科学。28 238-256. ·Zbl 1331.62135号 ·doi:10.1214/13-STS414
[14] Diggle,P.和Kenward,M.G.(1994年)。纵向数据分析中的信息缺失。J.R.统计社会服务。C.应用。统计数字43 49-93·Zbl 0825.62010号 ·doi:10.2307/2986113
[15] Dunson,D.B.和Xing,C.(2009年)。多元分类数据的非参数Bayes建模。J.艾默。统计师。协会104 1042-1051·Zbl 1388.62151号 ·doi:10.1198/jasa.2009.tm08439
[16] Erosheva,E.A.、Fienberg,S.E.和Junker,B.W.(2002)。大型稀疏多维列联表的替代统计模型和表示。Ann.工厂。科学。图卢兹数学。(6) 11 485-505. ·兹比尔1042.62057 ·doi:10.5802/afst.1035
[17] Frankel,L.和Hillygus,D.S.(2013年)。超越人口统计:ANES和GSS中的面板消耗。政治分析22 1-18。
[18] Gelman,A.和Carlin,J.B.(2001年)。后分层和权重调整。《调查无回应》(R.Groves、D.Dillman、J.Eltinge和R.Little编辑),纽约威利。
[19] Gelman,A.、Van Mechelen,I.、Verbeke,G.、Heitjan,D.F.和Meulders,M.(2005)。模型检查的多重插补:缺失数据和潜在数据的完整数据图。生物统计学61 74-85·Zbl 1077.62091号 ·doi:10.1111/j.0006-341X.2005.031010.x
[20] Gelman,A.、Jakulin,A.、Pittau,M.G.和Su,Y.-S.(2008)。逻辑和其他回归模型的弱信息默认先验分布。Ann.应用。统计2 1360-1383·Zbl 1156.62017年 ·doi:10.1214/08-AOAS191
[21] Gilens,M.(2005)。不平等和民主反应。《民意季刊》69 778-796。
[22] Groves,R.M.(2006)。家庭调查中的无应答率和无应答偏见。《民意季刊》70 646-675。
[23] Groves,R.M.和Couper,M.P.(1998)。家庭访谈调查中无回应。纽约威利·Zbl 0961.62007号
[24] Hausman,J.A.和Wise,D.A.(1979年)。实验数据和面板数据中的损耗偏差:加里收入维持实验。计量经济学47 455-473。
[25] He,Y.,Zaslavsky,A.M.,Landrum,M.B.,Harrington,D.P.和Catalano,P.(2010)。大规模复杂调查中的多重插补:实用指南。统计方法医学研究19 653-670·doi:10.1177/0962280208101273
[26] Henderson,M.和Hillygus,D.S.(2011年)。2008-2010年医疗保健意见的动态:党派性、利己主义和种族仇恨。《健康政治、政策和法律杂志》36 945-960。
[27] Henderson,M.、Hillygus,D.S.和Tompson,T.(2010年)。“酸葡萄”还是理性投票?2008年初选失利选民的投票决策。《民意季刊》。74 499-529.
[28] Hirano,K.、Imbens,G.W.、Ridder,G.和Rubin,D.B.(1998年)。将面板数据集与损耗和更新样本相结合。纽约国家经济研究局第230号技术报告·Zbl 1019.91037号 ·doi:10.1111/1468-0262.00260
[29] Hirano,K.、Imbens,G.W.、Ridder,G.和Rubin,D.B.(2001年)。将面板数据集与损耗和更新样本相结合。《计量经济学》69 1645-1659·Zbl 1019.91037号 ·doi:10.1111/1468-0262.00260
[30] 霍尔特·D和史密斯·T·M·F(1979)。后分层。J.罗伊。统计师。Soc.序列号。A 142 33-46。
[31] Honaker,J.和King,G.(2010年)。如何处理时间序列横截面数据中的缺失值。美国政治科学杂志。54 561-581.
[32] 易卜拉欣,J.G.、利普西茨,S.R.和陈,M.H.(1999)。当缺失数据机制不可忽略时,广义线性模型中的缺失协变量。J.R.统计社会服务。B.统计方法。61 173-190. ·Zbl 0917.62060号 ·doi:10.1111/1467-9868.00170
[33] Ishwaran,H.和James,L.F.(2001)。破胶前期吉布斯取样方法。J.艾默。统计师。协会96 161-173·Zbl 1014.62006年 ·doi:10.19198/0162114501750332758
[34] Iyengar,S.、Sood,G.和Lelkes,Y.(2012年)。情感,而非意识形态:对两极分化的社会认同视角。公共运营。问题76 405-431。
[35] Kenward,M.G.(1998年)。非随机丢失重复测量的选择模型:灵敏度说明。《Stat.Med.17 2723-2732》。
[36] Kenward,M.G.、Molenberghs,G.和Thijs,H.(2003)。具有适当时间依赖性的模式混合模型。生物特征90 53-71·Zbl 1035.62112号 ·doi:10.1093/biomet/90.1.53
[37] Kim,J.K.、Brick,J.M.、Fuller,W.A.和Kalton,G.(2006)。关于调查抽样中多重插补方差估计的偏差。J.R.统计社会服务。B.统计方法。68 509-521. ·Zbl 1110.62008年 ·doi:10.1111/j.1467-9868.2006.00546.x
[38] King,G.、Honaker,J.、Joseph,A.和Scheve,K.(2001年)。分析不完整的政治科学数据:多重插补的替代算法。美国政治科学。版次:95 49-69。
[39] Kruse,Y.、Callegaro,M.、Dennis,J.M.、Subias,S.、Lawrence,M.,DiSogra,C.和Tompson,T.(2009年)。AP-yahoo中的面板调节和磨损!新闻选举小组研究。在美国民意研究协会第64届会议上。佛罗里达州好莱坞。
[40] Lin,H.、McCulloch,C.E.和Rosenheck,R.A.(2004)。纵向研究中信息性间歇性缺失数据的潜在模式混合模型。生物统计学60 295-305·Zbl 1132.62362号 ·doi:10.1111/j.0006-341X.2004.00173.x
[41] Little,R.J.A.(1993年)。多元不完全数据的模式混合模型。J.艾默。统计师。协会88 125-134·Zbl 0775.62134号 ·doi:10.2307/2290705
[42] Little,R.J.A.(1994年)。正常不完全数据的一类模式混合模型。Biometrika 81 471-483·Zbl 0816.62023号 ·doi:10.1093/biomet/81.3.471
[43] Lohr,S.L.(1999)。取样:设计和分析。纽约达克斯伯里出版社·Zbl 0967.62005年
[44] Loosveldt,G.和Carton,A.(1997年)。1991-1995年比利时选举小组研究中的无回应评估。在JSM会议记录中,关于调查研究方法的章节1017-1022。阿默尔。统计师。加利福尼亚州阿纳海姆协会。
[45] Lumley,T.(2012)。调查:分析复杂的调查样本。R软件包版本3.28-2。
[46] Lynn,P.(2005年)。与纵向调查设计和数据收集相关的方法研究综述。技术报告,英国埃塞斯大学社会经济研究所。
[47] 孟晓乐(1994a)。输入来源不一致的多重插补推断(光盘:P558-573)。统计师。科学。9 538-558.
[48] 孟晓乐(1994b)。后验预测值。安。统计师。22 1142-1160. ·Zbl 0820.62027号 ·doi:10.1214/aos/1176325622
[49] Muthén,B.、Jo,B.和Brown,C.H.(2003)。打破随机实验的主要分层方法:纽约市择校券的案例研究[附评论]。J.艾默。统计师。协会98 311-314·Zbl 1047.62120号 ·doi:10.1198/016214500300071
[50] Olsen,R.J.(2005)。受访者流失问题:调查方法是关键。周一。劳工版次128 63-71。
[51] Olson,K.和Witt,L.(2011年)。我们留住了以前留下来的人吗?随着时间的推移,小组调查人员流失的相关因素发生了变化。社会科学。第40号决议1037-1050。
[52] Pasek,J.、Tahk,A.、Lelkes,Y.、Krosnick,J.A.、Payne,B.K.、Akhtar,O.和Tompson,T.(2009)。2008年美国总统大选投票率和候选人选择的决定因素揭示了种族偏见和其他因素的影响。公共运营。问题73 943-994。
[53] Roy,J.(2003)。使用潜在辍学类别模型对具有不可忽视辍学的纵向数据进行建模。生物统计学59 829-836·Zbl 1218.62117号 ·doi:10.1111/j.0006-341X.2003.0097.x
[54] Roy,J.和Daniels,M.J.(2008)。一类具有许多可能的丢失时间的不可忽略丢失的模式混合模型。生物计量学64 538-545668·Zbl 1137.62016年 ·doi:10.1111/j.1541-0420.2007.00884.x
[55] Rubin,D.B.(1987)。调查中无应答的多重插补。纽约威利·2007年6月10日
[56] Scharfstein,D.O.、Rotnitzky,A.和Robins,J.M.(1999年)。使用半参数无响应模型调整不可忽视的退出。J.艾默。统计师。协会94 1096-1146·Zbl 1072.62644号 ·doi:10.2307/2669923
[57] Schifeling,T.、Cheng,C.、Reiter,J.P.和Hillygus,D.S.(2015)。用刷新样本进行小组研究时,考虑不可忽视的单位无响应和损耗。调查统计与方法杂志3 265-295。
[58] Schluchte,M.D.(1982年)。信息审查纵向数据的分析方法。Stat.Med.11 1861-1870年。
[59] Sekhon,J.(2004)。选民信息在民主社会中的作用各不相同。加州大学伯克利分校工作文件。
[60] Sethuraman,J.(1994)。Dirichlet先验的构造性定义。统计师。Sinica 4 639-650号·Zbl 0823.62007号
[61] Si,Y.和Reiter,J.P.(2013)。大规模评估调查中不完全分类变量的非参数贝叶斯多重插补。J.教育。行为。《美国联邦法律大全》第38卷第499-521页。
[62] Si,Y.、Reiter,J.P.和Hillygus,D.S.(2014)。刷新样本小组研究中潜在不可忽视损耗的半参数选择模型。政治分析。23 92-112.
[63] Si,Y.,Reiter,J.P.和Hillygus,D.S.(2016)。补充“贝叶斯潜在模式混合模型,用于处理刷新样本的面板研究中的损耗”·Zbl 1454.62056号
[64] Smith,T.W.和Son,J.(2010)。2006-2008年一般社会调查小组的小组流失和小组变动分析,技术报告,GSS方法论报告第118号。芝加哥:NORC。
[65] Vermunt,J.K.、Ginkel,J.R.V.、der Ark,L.A.V.和Sijtsma,K.(2008)。使用潜在类别分析对不完整分类数据进行多重插补。社会学。方法。38 369-397.
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。