×

基于重采样的多变量回归模型选择中的子采样与自举。 (英语) Zbl 1393.62059号

摘要:近年来,人们越来越关注多变量回归模型的稳定性问题,即模型对所拟合数据的微小变化的阻力。为了解决这个问题,开发了主要基于引导的重采样技术。特别是,基于“包含频率”思想的方法考虑了变量选择过程的重复实现,例如在多个引导样本上向后消除。对每次迭代中选择的变量的分析提供了关于模型稳定性和变量重要性的有用信息。然而,最近的研究结果表明,自举法的使用可能存在缺陷,文献中已经开始考虑诸如二次抽样等替代方法。使用模型选择频率和可变包含频率,我们对这两种不同的重采样技术进行了实证比较,研究了它们在多变量回归的选定经典模型选择过程中的使用效果。我们通过分析两个实际数据示例和进行模拟研究来进行调查。我们的结果揭示了在这种情况下使用子采样技术而不是引导技术的一些优势。

MSC公司:

第62页第10页 统计学在生物学和医学中的应用;元分析
62G09号 非参数统计重采样方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Akaike,H.1973第二届信息理论国际研讨会267 281
[2] Altman,Cox回归模型稳定性的Bootstrap调查,《医学统计学》8 pp 771–(1989)·数字对象标识代码:10.1002/sim.4780080702
[3] Bickel,bootstrap的一些渐近理论,《统计年鉴》第7页,1196–(1981)·兹比尔0449.62034 ·doi:10.1214/aos/1176345637
[4] Bickel,《重新抽样少于n个观察值:收益、损失和损失补救措施》,《中国统计》第7卷第1页–(1997年)·Zbl 0927.62043号
[5] Bickel,《关于m in the m of n bootstrap中m的选择及其在极端百分位数置信界限中的应用》,《中国统计》第18卷第967页–(2008)
[6] Buchholz,《关于用两步bootstrap模型平均法导出的预测因子的性质:线性回归模型中的模拟研究》,《计算统计与数据分析》52页2778–(2008)·Zbl 1452.62038号 ·doi:10.1016/j.csda.2007.10.07
[7] Chen,通过Cox比例风险回归模型引导和识别预后因素,《医学统计学》4第39页–(1985)·数字对象标识代码:10.1002/sim.4780040107
[8] Chernick,M.R.2011 Bootstrap方法:从业者和研究人员指南·Zbl 1136.62029号
[9] Copas,用变量选择估计正交回归中的剩余方差,《统计学家》40第51页–(1991)·doi:10.2307/2348223
[10] Davison,自举方法的最新发展,《统计科学》18,第141页–(2003)·Zbl 1331.62179号 ·doi:10.1214/ss/1063994969
[11] del Barrio,低重采样强度的重采样方案及其在测试假设中的应用,《统计规划与推断杂志》139,第184页–(2009)·Zbl 1149.62035号 ·doi:10.1016/j.jspi.2008.04.002
[12] 埃夫隆(Efron),《Bootstrap methods:Another look at the jackknife》,《统计学年鉴》(the Annals of Statistics)第7页第1页–(1979)·Zbl 0406.62024号 ·doi:10.1214/aos/1176344552
[13] Gifi,A.1990非线性多元分析·Zbl 0697.62048号
[14] Gong,G.1982计算机科学与统计:第十四届接口研讨会论文集169 173
[15] Hartigan,《使用子样本值作为典型值》,《美国统计协会杂志》第64期,第1303页–(1969年)·网址:10.1080/01621459.1969.10501057
[16] 《Ihorst,长期和中期臭氧对肺部生长的影响,包括广泛的接触范围》,《欧洲呼吸杂志》23页292–(2004)·数字对象标识代码:10.1183/09031936.04.00021704
[17] Janitza,自举样本的假设检验和模型选择的陷阱:生物特征应用中的原因和后果,《生物统计学杂志》(2015)·Zbl 1386.62053号 ·doi:10.1002/bimj.201400246
[18] Janitza,基于AUC的随机森林排列变量重要性度量,BMC生物信息学14 pp 119–(2013)·doi:10.1186/1471-2105-14-119
[19] Mammen,E.1992 Bootstrap何时起作用·Zbl 0760.62038号
[20] Mammen,E.Nandi,S.2012计算统计手册499 527
[21] Meinshausen,《用套索选择高维图和变量》,《统计年鉴》第34卷第1436页–(2006年)·Zbl 1113.62082号 ·doi:10.1214/09053606000000281
[22] Meinshausen,稳定性选择,《皇家统计学会杂志:B辑(统计方法)》,72 pp 417–(2010)·文件编号:10.1111/j.1467-9868.2010.00740.x
[23] Miller,A.2002回归中的子集选择·Zbl 1051.62060号
[24] Pepe,M.S.2003医学检验分类和预测的统计评估·Zbl 1039.62105号
[25] Politis,D.Romano,J.Wolf,M.1999次采样·Zbl 0931.62035号
[26] Politis,最小假设下基于子样本的大样本置信区间,《统计年鉴》22页2031–(1994)·Zbl 0828.62044号 ·doi:10.1214/aos/1176325770
[27] Rospleszcz,S.Janitza,S.Boulesteix,A.-L.2014年
[28] Royston,P.Sauerbrei,W.2008多变量建模:基于分数多项式建模连续变量的回归分析实用方法·Zbl 1269.62053号
[29] Sauerbrei,W.1992回归模型中的变量选择
[30] Sauerbrei,W.1993欧洲医学信息学、生物医学和流行病学透视108 113
[31] Sauerbrei,《使用重采样方法简化医学统计中的回归模型》,《皇家统计学会杂志:C辑(应用统计)》,48页,313–(1999)·Zbl 0939.62114号 ·doi:10.1111/1467-9876.00155
[32] Sauerbrei,《关于推导多变量回归模型的稳定性问题》,《生物医学杂志》第57卷第531页–(2015年)·Zbl 1329.62035号 ·doi:10.1002/bimj.201300222
[33] Sauerbrei,模型构建的自举重采样程序:Cox回归模型的应用,《医学统计学》11页2093–(1992)·doi:10.1002/sim.4780111607
[34] Schwarz,估算模型的维度,《统计年鉴》第6卷第461页–(1978年)·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[35] 邵,折刀方差估计的一般理论,《统计学年鉴》第17卷第1176页–(1989)·兹比尔0684.62034 ·doi:10.1214/aos/1176347263
[36] Tutz,G.2012分类数据回归·Zbl 1304.62021号
[37] Wu,Jackknife,bootstrap和回归分析中的其他重采样方法,《统计年鉴》第14卷第1261页–(1986)·Zbl 0618.62072号 ·doi:10.1214/aos/1176350142
[38] Zelterman,具有截尾观测的比例风险模型的Bootstrap技术,统计学和计算6,第191页–(1996)·doi:10.1007/BF00140864
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。