×

健康检查调查中缺失数据的贝叶斯模型不是随机的。 (英语) Zbl 07289501号

摘要:在流行病学调查中,由于调查无反应而导致的非随机数据缺失(MNAR)可能会导致风险因素估计的偏差。我们提出了一种基于贝叶斯数据增强和生存模型的方法来减少无响应偏差。该方法需要根据后续数据提供更多信息。我们利用1972年至2007年收集的FINRISK数据,对吸烟流行率进行了一项个案研究,并对2012年底进行了随访,并将其与其他常用的随机缺失(MAR)插补方法进行了比较。通过仿真实验研究了这些方法的有效性。我们的方法似乎大大减少了无反应偏差,而MAR插补在减少偏差方面并不成功。

MSC公司:

62至XX 统计学
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Brooks,SP,Gelman,A(1998)监测迭代模拟收敛性的一般方法。计算与图形统计杂志, 7, 434-55.
[2] Celeux,G,Marin,J-M,Robert,CP(2006),缺失数据问题中的迭代重要性抽样。计算统计与数据分析,5033386-3404·Zbl 1445.62004号 ·doi:10.1016/j.csda.2005.07.018
[3] Doll,R,Hill,AB(1956)肺癌和其他与吸烟有关的死亡原因。英国医学杂志, 2, 1071-81. ·doi:10.1136/bmj.2.5001.1071
[4] Haario,H,Saksman,E,Tamminen,J(2001)自适应大都会算法。伯努利, 7, 223-42. 网址https://projecteuclid.org/euclid.bj/1080222083(上次访问日期:2017年8月14日)·Zbl 0989.65004号
[5] Harald,K,Salomaa,V,Jousilahti,P,Koskinen,S,Vartiainen,E(2007)不同社会经济群体的非参与性和死亡率:1972-92年的FINRISK人口调查。流行病学与社区卫生杂志, 61, 449-54. ·doi:10.1136/jech.2006.049908
[6] Jousirahti,P,Salomaa,V,Kuulasmaa,K,Niemelä,M,Vartiainen,E(2005)基于人口的健康调查参与者和非参与者的总死亡率和特定原因死亡率:对54372名芬兰男性和女性的全面随访。流行病学与社区卫生杂志, 59, 310-15. ·doi:10.1136/jech.2004.024349
[7] Karvanen,J(2015)因果模型中的研究设计。斯堪的纳维亚统计杂志, 42, 361-77. ·Zbl 1378.62037号 ·doi:10.1111/sjos.12110
[8] Karvanen,J,Tolonen,H,Härkänen,T,Jousilahti,P,Kuulasmaa,K(2016)通过重新接触非参与者,减少了选择偏差。临床流行病学杂志, 76, 209-17. ·doi:10.1016/j.jclinepi.2016.02.026
[9] Kopra,J,Härkänen,T,Tolonen,H,Karvanen,J(2015)纠正吸烟趋势中不容忽视的缺失。斯达, 4, 1-14. ·doi:10.1002/sta4.73
[10] Laatikainen,T,Tapanainen,H,Alfthan,G,Salminen,I,Sundvall,J,Leiviskä,J,Harald,K,Jousilahti,P,Salomaa,V,Vartiainen,E(2003)FINRISKI 2002:Tutkimuksen totutus ja tulokset(图卢克塞特)芬兰赫尔辛基:国家公共卫生研究所。
[11] Mannino,DM,Buist,AS(2007)《COPD的全球负担:风险因素、患病率和未来趋势》。刺胳针, 370, 765-73. ·doi:10.1016/S0140-6736(07)61380-4
[12] Plummer,M(2003)JAGS:使用吉布斯抽样分析贝叶斯图形模型的程序。第三届分布式统计计算国际研讨会论文集(124125)。奥地利维也纳:维也纳理工大学。
[13] 普卢默,M(2015)rjags:使用MCMC的贝叶斯图形模型。R包版本3-15。网址https://CRAN.R-project.org/package=rjags(上次访问日期:2017年8月14日)。
[14] R统计计算基金会(2016)R: 统计计算语言和环境.奥地利维也纳.URLhttps://www.R-project.org/(上次访问日期:2017年8月14日)。
[15] Robert,CP,Casella,G(2004)蒙特卡罗统计方法纽约州纽约市:施普林格·Zbl 1096.62003年 ·数字对象标识代码:10.1007/978-1-4757-4145-2
[16] Rubin,DB(1976),推断和缺失数据。生物特征, 63, 581-92. ·兹伯利0344.62034 ·doi:10.1093/biomet/63.3.581
[17] Shahar,E,Folsom,AR,Jackson,R(1996)无反应对参考人群流行率估计的影响:基于人群的队列研究的见解。流行病学年鉴, 6, 498-506. ·doi:10.1016/S1047-2797(96)00104-4
[18] Tanner,MA,Wong,WH(1987)通过数据增强计算后验分布。美国统计协会杂志, 82, 528-40. ·Zbl 0619.62029号 ·doi:10.1080/01621459.1987.10478458
[19] van Buuren,S(2012)缺失数据的灵活插补。佛罗里达州博卡拉顿:CRC新闻·Zbl 1256.62005年 ·doi:10.1201/b11826
[20] van Buuren,S,Groothuis-Oudshoorn,K(2011)《小鼠:通过R中的连锁方程进行多元插补》。统计软件杂志, 45, 1-67. 网址http://www.jstatsoft.org/v45/i03/(上次访问日期:2017年8月14日)。
[21] White,IR,Royston,P(2009)为Cox模型估算缺失的协变量值。医学统计学, 28, 1982-98. ·数字对象标识代码:10.1002/sim.3618
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。