×

多重插补后的模型选择和模型平均。 (英文) Zbl 1471.62181号

摘要:模型选择和模型平均是应用研究中获得实用模型的两项重要技术。然而,众所周知,当选择过程的随机性被忽略,并且估计值、标准误差和置信区间被计算出来时,就好像所选模型是已知的一样,会出现许多复杂的问题,特别是在模型选择的背景下先验的虽然模型平均旨在通过组合一组模型的估计值来纳入与模型选择过程相关的不确定性,但对于适当的解释和置信区间的构建仍存在一些争议。由于缺少数据,这些问题变得更加复杂,目前尚不完全清楚如何继续。为了处理这种情况,提出了一个在缺失数据背景下进行模型选择和模型平均的框架。重点在于将多重插补作为一种处理缺失的策略:与模型平均相结合的结果旨在纳入与模型选择和插补过程相关的不确定性。此外,还评估了引导作为我们框架的灵活扩展的性能。蒙特卡罗模拟用于揭示线性回归模型背景下拟议估计量的性质。我们的方法的实际意义通过最近一项关于肺结核痰培养转化的生存研究来说明。

MSC公司:

62-08 统计问题的计算方法
62J05型 线性回归;混合模型
62D10号 缺少数据
10层62层 点估计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akaike,H.,1973年。《信息理论与最大似然原理的扩展》,载《第二届布达佩斯信息理论国际研讨会论文集》,第267-281页·Zbl 0283.62006号
[2] 巴克兰,S.T。;Burnham,K.P。;新罕布什尔州奥古斯丁,《模型选择:推理的一个组成部分》,《生物统计学》,第53期,第603-618页,(1997年)·Zbl 0885.62118号
[3] 卡瓦诺,J。;Shumway,R.,《不完全数据下模型选择的Akaike信息标准》,《统计规划与推断杂志》,67,45-65,(1998)·Zbl 1067.62504号
[4] Chatfield,C.,《模型不确定性、数据挖掘和统计推断》,《皇家统计学会期刊A》,158419-466,(1995)
[5] Claeskens,G。;Consentino,F.,不完全协变量数据的变量选择,生物计量学,641062-1069,(2008)·Zbl 1152.62388号
[6] Claeskens,G。;Hjort,N.L.,《聚焦信息标准(讨论)》,《美国统计协会杂志》,98,900-916,(2003)·Zbl 1045.62003号
[7] Draper,D.,《模型不确定性的评估和传播》,《皇家统计学会期刊》B,57,45-97,(1995)·Zbl 0812.62001号
[8] Drechsler,J。;Rässler,S.,收敛真的重要吗?,(Shalabh;Heumann,C.,线性模型和相关领域的最新进展,(2008),Springer),342-355
[9] 弗莱彻,D。;Dillingham,P.,阶乘实验的模型平均置信区间,计算统计与数据分析,553041-3048,(2011)
[10] Hansen,B.E.,最小二乘模型平均,《计量经济学》,75,1175-1189,(2007)·Zbl 1133.91051号
[11] Hansen,B.E。;Racine,J.,Jackknife模型平均值,《计量经济学杂志》,167,38-46,(2012)·兹比尔1441.62721
[12] Hens,N。;阿尔茨,M。;Molenberghs,G.,不完全样本和基于设计样本的模型选择,《医学统计学》,25,2502-2520,(2006)
[13] Heumann,C.,Grenke,M.,2010年。使用带有拉普拉斯先验的贝叶斯估计的逻辑回归模型的有效模型平均过程。收录:Kneib,T.,Tutz,G.(编辑),《统计建模和回归结构》。《物理学》,第79-90页。
[14] Hjort,L。;Claeskens,G.,Frequentist模型平均估计量,《美国统计协会杂志》,9879-945,(2003)·Zbl 1047.62003年
[15] Hjort,N.L。;Claeskens,G.,考克斯风险回归模型的集中信息标准和模型平均,美国统计协会杂志,1011449-1464,(2006)·Zbl 1171.62350号
[16] Hoeting,J.A。;Madigan,D。;Raftery,A.E。;Volinsky,C.T.,《贝叶斯模型平均:教程》,《统计科学》,第14382-417页,(1999)·Zbl 1059.62525号
[17] Honaker,J。;King,G.,《如何处理时间序列横截面数据中的缺失值》,《美国政治科学杂志》,54,561-581,(2010)
[18] Honaker,J.,King,G.,Blackwell,M.,2010年。Amelia 2:缺失数据的程序。R软件包版本1.5。http://gking.harvard.edu/amelia。
[19] 北卡罗来纳州霍顿。;Kleinman,K.,《无事生非:缺失数据方法与软件的比较以拟合不完全回归模型》,《美国统计学家》,第61期,第79-90页,(2007年)
[20] Ishwaran,H。;Rao,J.,讨论,《美国统计协会杂志》,98,922-925,(2003)
[21] 卡贝拉,P。;Leeb,H.,关于模型选择后置信区间的大样本最小覆盖概率,美国统计协会杂志,101619-629,(2006)·Zbl 1119.62322号
[22] Leeb,H。;Pötscher,B.M.,《模型选择与推断:事实与虚构》,《计量经济学理论》,第21期,第21-59页,(2005年)·Zbl 1085.62004号
[23] Leeb,H。;Pötscher,B.M.,人们能估计模型选择后估计量的条件分布吗?,《统计年鉴》,342554-2591,(2006)·Zbl 1106.62029号
[24] Leeb,H。;Pötscher,B.M.,人们能估计模型选择后估计量的无条件分布吗?,计量经济学理论,24,338-376,(2008)·兹比尔1284.62152
[25] Liang,H。;邹,G。;Wan,A。;Zhang,X.,频率模型平均估值器的最优权重选择,美国统计协会杂志,1061053-1066,(2011)·Zbl 1229.62090号
[26] Lipsitz,S。;帕尔岑,M。;赵,L.,多重插补中的自由度近似,《统计计算与模拟杂志》,72,309-318,(2002)·Zbl 0995.62006号
[27] 利特尔·R。;Rubin,D.,《数据缺失的统计分析》,(2002年),纽约威利出版社·Zbl 1011.62004号
[28] 马格纳斯,J。;O.鲍威尔。;Prüfer,P.,《两种模型平均技术的比较及其在增长经验中的应用》,《计量经济学杂志》,154139-153,(2010)·Zbl 1431.62654号
[29] 马格纳斯,J。;Wan,A。;张欣,非球面扰动下的加权平均最小二乘估计及其在香港住房市场的应用,计算统计与数据分析,551331-1341,(2011)·Zbl 1328.65034号
[30] May,M。;Boulle,A.等人。;菲里,S。;Messou,E。;Myer,L。;木材,R。;斯特恩,J。;Dabis,F。;Egger,M.,《撒哈拉以南非洲HIV-1感染患者开始治疗的预后:扩大计划的合作分析》,《柳叶刀》,376,449-457,(2010)
[31] Molenberghs,G。;Fitzmaurice,G.,《不完整数据:介绍和概述》,(Fitzmanurice,G;Davidian,M.;Verbeke,G;Molenberghs,G.《纵向数据分析》,(2009),CRC出版社),395-408
[32] Pötscher,B.,《模型平均估计量的分布及其估计的不可能结果》,(Ho,H.;Ing,C.;Lai,T.,IMS演讲笔记:时间序列和相关主题,第52卷,(2006)),113-129·Zbl 1268.62066号
[33] Raftery,A.,Hoeting,J.,Volinsky,C.,Painter,I.,Yeung,K.,2011年。BMA:贝叶斯模型平均。R软件包版本3.14。http://CRAN.R-project.org/package=BMA。
[34] Rao,C。;Wu,Y.,关于模型选择,IMS讲义-专题系列,38,1-64,(2001)
[35] Rubin,D.,《贝叶斯自助法》,《统计年鉴》,第9期,第130-134页,(1981年)
[36] 鲁宾,D。;Schenker,N.,从可忽略无响应的简单随机样本进行区间估计的多重插补,美国统计协会杂志,81,366-374,(1986)·Zbl 0615.62011号
[37] Schomaker,M.,收缩平均估计,统计论文,531015-1034,(2012)·Zbl 1254.62082号
[38] Schomaker,M。;Heumann,C.,《因子分析中的模型平均:奥运十项全能数据分析》,《体育定量分析杂志》,2011年第7期,第1期,第4条
[39] Schomaker,M。;Wan,A.T.K。;Heumann,C.,带缺失观测值的频繁模型平均,计算统计与数据分析,54,3336-3347,(2010)·Zbl 1284.62063号
[40] Shimodaira,H.,从部分观测数据中选择模型的新标准,(Cheesman,P.;Oldford,R.,《从数据中选择模式:人工智能和统计》,第四卷,(1994),Springer),21-29·Zbl 0828.62004号
[41] Stone,M.,统计预测的交叉验证选择和评估,英国皇家统计学会杂志B,36111-147,(1974)·Zbl 0308.62063号
[42] Turek,D。;Fletcher,D.,模型平均Wald置信区间,计算统计与数据分析,562809-2815,(2012)·Zbl 1255.62141号
[43] 维瑟,M。;斯特德,M。;Walzl,G。;沃伦,R。;Schomaker,M。;格雷瓦尔,H。;斯瓦特,E。;Maartens,G.,肺结核痰菌转化的基线预测因素:空洞的重要性、吸烟、检测时间和W-Beijing基因型,PLoS ONE,7,e29588,(2012)
[44] Wan,A.T.K。;张,X。;Zou,G.H.,用马尔洛准则进行最小二乘模型平均,计量经济学杂志,156,277-283,(2010)·Zbl 1431.62291号
[45] Wang,H。;张,X。;Zou,G.,《频繁模型平均:综述》,《系统科学与复杂性杂志》,22732-748,(2009)·Zbl 1300.93164号
[46] 王宏,周S.,2012。《使用频率模型平均法进行区间估计》,《统计学中的通信——理论和方法》(2013年)(即将出版)·Zbl 1462.62117号
[47] Wang,H。;邹,G。;Wan,A.,变系数部分线性测量误差模型的模型平均,《电子统计杂志》,61017-1039,(2012)·Zbl 1281.62054号
[48] 白色,I。;罗伊斯顿,P。;Wood,A.,《使用链式方程的多重插补》,《医学统计学》,30377-399,(2011)
[49] 伍德,A。;白色,I。;Royston,P.,如何使用多重插补数据进行变量选择?,医学统计,27,3227-3246,(2008)
[50] Yan,J.,《享受copulas的乐趣:使用copula包》,《统计软件杂志》,21,1-21,(2007)
[51] 张,X。;Wan,A。;Zhou,S.,非零阈值tobit模型中的聚焦信息标准、模型选择和模型平均,《商业与经济统计杂志》,30,132-142,(2012)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。