×

线性混合模型的子集选择。 (英语) Zbl 1522.62166号

概述:线性混合模型(LMM)有助于进行结构化相关性的回归分析,如分组、聚类或多级数据。然而,在考虑这种结构性依赖的同时,在协变量之间进行选择仍然是一个挑战。我们介绍了一种基于LMM的贝叶斯决策分析子集选择方法。使用包含结构相关性的马氏损失函数,我们导出了(i)任何给定变量子集和(ii)满足基数约束的所有变量子集的最优线性系数。重要的是,这些估计继承了基础贝叶斯模型的收缩或正则化和不确定性量化,并适用于任何指定的贝叶斯LMM。更广泛地说,我们的决策分析策略不再强调单个“最佳”子集的作用,因为该子集的信息内容通常不稳定且有限,而倾向于收集近最优子集。该集合由关键成员子集和变量特定的重要性度量进行总结。提供了定制的子集搜索和样本外近似算法,以实现更具扩展性的计算。这些工具应用于模拟数据和纵向体力活动数据集,并显示出出色的预测、估计和选择能力。
©2022国际生物识别学会。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bashir,A.、Carvalho,C.M.、Hahn,P.R.和Jones,M.B.(2019)对精度矩阵进行后处理以生成稀疏图估计。贝叶斯分析,14(4),1075-1090·Zbl 1435.62103号
[2] Bertsimas,D.、King,A.和Mazumder,R.(2016)通过现代优化透镜进行最佳子集选择。《统计年鉴》,44(2),813-852·Zbl 1335.62115号
[3] Bhattacharya,A.、Chakraborty,A.和Mallick,B.K.(2016)高维回归中高斯混合先验的快速采样。《生物特征》,103(4),985-991。
[4] Bondell,H.D.、Krishna,A.和Ghosh,S.K.(2010)线性混合效应模型中固定效应和随机效应的联合变量选择。生物统计学,66(4),1069-1077·Zbl 1233.62134号
[5] 美国疾病控制与预防中心。国家卫生统计中心(NCHS)。(2021)国家健康和营养检查调查数据。马里兰州凯亚茨维尔:美国卫生与公众服务部疾病控制与预防中心,https://wwwn.cdc.gov/nchs/nhanes。
[6] Chen,Z.&Dunson,D.B.(2003)线性混合模型中的随机效应选择。生物统计学,59(4),762-769·Zbl 1214.62027号
[7] Dong,J.&Rudin,C.(2019)《可变重要性云:探索良好模型集可变重要性的方法》。arXiv预打印arXiv:1901.03209。
[8] Fan,Y.和Li,R.(2012)线性混合效应模型中的变量选择。《统计年鉴》,40(4),2043年·Zbl 1257.62077号
[9] Fishman,E.I.、Steeves,J.A.、Zipunnikov,V.、Koster,A.、Berrigan,D.、Harris,T.A.和Murphy,R.(2016)NHANES中客观测量的体力活动与死亡率之间的关系。运动与运动医学与科学,48(7),1303-1311。
[10] Foster,S.D.、Verbyla,A.P.和Pitchford,W.S.(2007)将LASSO效应纳入定量性状位点检测的混合模型。农业、生物和环境统计杂志,12(2),300-314·Zbl 1306.62275号
[11] Furnival,G.M.&Wilson,R.W.(2000)《跨越式回归》。技术计量学,42(1),69-79。
[12] Hahn,P.R.和Carvalho,C.M.(2015)贝叶斯线性模型中的解耦收缩和选择:后验总结视角。《美国统计协会杂志》,110(509),435-448·兹比尔1373.62036
[13] Hastie,T.,Tibshirani,R.&Tibshilani,R.(2020)最佳子集,向前逐步还是拉索?基于广泛比较的分析和建议。统计科学,35(4),579-592·Zbl 07307187号
[14] Ibrahim,J.G.,Zhu,H.,Garcia,R.I.&Guo,R.(2011)混合效应模型中的固定效应和随机效应选择。生物统计学,67(2),495-503·Zbl 1217.62171号
[15] Jiang,J.,Rao,J.S.,Gu,Z.&Nguyen,T.(2008)混合模型选择的围栏方法。《统计年鉴》,36(4),1669-1692年·Zbl 1142.62047号
[16] Kinney,S.K.和Dunson,D.B.(2007)线性和逻辑模型中的固定和随机效应选择。生物统计学,63(3),690-698·Zbl 1147.62022号
[17] Kowal,D.R.(2021)使用参数化决策分析进行快速、最优和有针对性的预测。美国统计协会杂志。
[18] Kowal,D.R.(2022)可解释预测和分类的贝叶斯子集选择和变量重要性。机器学习研究杂志,23(108),1-38。
[19] Kowal,D.R.和Bourgeois,D.C.(2020)高维数据的贝叶斯函数标度回归。计算与图形统计杂志,29(3),1-10·Zbl 07499302号
[20] Kowal,D.R.、Bravo,M.、Leong,H.、Griffin,R.J.、Ensor,K.B.和Miranda,M.L.(2021)用于理解环境暴露中混合物的贝叶斯变量选择。医学统计学,40(22),4850-4871。
[21] Lindley,D.V.(1968)多元回归中变量的选择。英国皇家统计学会杂志:B辑(方法学),30(1),31-53·Zbl 0155.26702号
[22] Meinshausen,N.&Bühlmann,P.(2010)稳定性选择。英国皇家统计学会杂志。B辑:统计方法,72(4),417-473·兹比尔1411.62142
[23] Miller,A.J.(1984)回归变量子集的选择。《皇家统计学会杂志:A辑(综述)》,147(3),389-410·Zbl 0584.62106号
[24] Müller,S.、Scealy,J.L.和Welsh,A.H.(2013)线性混合模型中的模型选择。统计科学,28(2),135-167·Zbl 1331.62364号
[25] Nishimura,A.和Suchard,M.A.(2018)“大n和大p”贝叶斯稀疏回归中加速吉布斯采样的先验预处理共轭梯度法。arXiv预打印arXiv:1810.12437。
[26] Puelz,D.、Hahn,P.R.和Carvalho,C.M.(2017)随机预测的看似无关回归中的变量选择。贝叶斯分析,12(4),969-989·Zbl 1384.62262号
[27] Wang,D.、Eskridge,K.M.和Crossa,J.(2011)使用适应性混合LASSO鉴定结构化植物群体中的QTL和上位性。农业、生物和环境统计杂志,16(2),170-184·Zbl 1306.62358号
[28] Zhao,S.,Witten,D.&Shojaie,A.(2021)《为不可辩护辩护:一种非常天真的高维推理方法》。统计科学,36(4),562-577·Zbl 07473936号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。