×

多元纵向混合模型的稀疏两两似然估计。 (英语) Zbl 1409.62151号

摘要:在纵向研究中,收集和分析多种反应的数据越来越普遍。例如,在社会科学领域,我们可能有兴趣发现随着时间推移个人心理健康的驱动因素,其中心理健康是使用一组问卷项目来衡量的。分析多维数据的一种方法是多元混合模型,它是标准单变量混合模型的扩展,用于处理多个响应。然而,估计多元混合模型是一个相当大的挑战,更不用说进行变量选择,以发现哪些协变量在驱动每个响应方面是重要的。基于复合似然思想,我们提出了一种新的多元混合模型估计和固定效应选择方法,称为近似两两似然估计和收缩(APLES)。该方法的工作原理是对两两似然函数中的每个项构造一个二次近似,然后用一个惩罚来增加这个近似的两两似度,该惩罚鼓励个体和群体系数稀疏性。这导致了一种相对快速的选择方法,因为我们可以使用坐标上升型方法来构建模型的完整正则化路径。我们的方法首次将惩罚似然估计推广到多元广义线性混合模型。我们证明了APLES估计获得了oracle属性的复合似然版本。
我们提出了一种新的选择调整参数的信息准则,该准则采用动态模型复杂性惩罚来促进主动收缩,并证明了它渐进地导致选择一致性,即导致选择真实模型。一项仿真研究表明,APLES估计器在分别分析每个结果的基础上优于几种单变量选择方法。

MSC公司:

62J12型 广义线性模型(逻辑模型)
62甲12 多元分析中的估计
62J07型 岭回归;收缩估计器(拉索)
PDF格式BibTeX公司 XML格式引用
全文: DOI程序 链接

参考文献:

[1] 贝茨,D。;Mächler,M。;Bolker,B。;Walker,S.,使用lme4拟合线性混合效应模型,《统计软件杂志》,67,1-48(2015)
[2] 邦德尔·H·D。;克里希纳。;Ghosh,S.K.,线性混合效应模型中固定和随机效应的联合变量选择,生物统计学,661069-1077(2010)·Zbl 1233.62134号
[3] 邦德尔·H·D。;Reich,B.J.,同步回归收缩、变量选择和OSCAR预测值的监督聚类,生物统计学,64,115-123(2008)·Zbl 1146.62051号
[4] Christensen,R.H.B.,有序数据的有序回归模型(2015)
[5] Faes,C。;阿尔茨,M。;Molenberghs,G。;盖斯,H。;Teuns,G。;Bijnens,L.,不同性质纵向结果的高维联合模型,医学统计学,274408-4427(2008)
[6] 菲尤斯,S。;Verbeke,G.,用于多变量纵向轮廓联合建模的混合模型的成对拟合,生物计量学,62424-431(2006)·Zbl 1097.62058号
[7] 菲尤斯,S。;韦贝克,G。;Boen,F。;Delecluse,C.,二元问卷数据的高维多元混合模型,英国皇家统计学会杂志,C系列,55,449-460(2006)·Zbl 1490.62403号
[8] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,通过坐标下降的广义线性模型的正则化路径,统计软件杂志,33,1-22(2010)
[9] 高,X。;Song,P.X.-K.,高维数据中模型选择的复合似然贝叶斯信息标准,美国统计协会杂志,105,1531-1540(2010)·Zbl 1388.62034号
[10] 加西亚,T.P。;缪勒,S。;卡罗尔·R·J。;Walzem,R.L.,《通过正则化方法识别重要回归组、亚组和个体:应用于肠道微生物组数据》,生物信息学,30831-837(2014)
[11] 格罗尔,A。;Tutz,G.,广义线性混合模型的变量选择\(Ş_1\)-惩罚估计、统计和计算,24,137-154(2014)·Zbl 1325.62139号
[12] 枪,F。;Bondell,H.D.,《变量选择的置信区调整方法》,《计算与图形统计杂志》,21,295-314(2012)
[13] 黄,J。;Breheny,P。;Ma,S.,《高维模型中群体选择的选择性综述》,统计科学,27481-499(2012)·Zbl 1331.62347号
[14] Hui,F.K.C。;穆勒,S。;Welsh,A.H.,使用正则化PQL在混合模型中的联合选择,美国统计协会杂志(2016)
[15] Hui,F.K.C。;穆勒,S。;Welsh,A.H.,广义线性混合模型中固定效应和随机效应的层次选择,统计学,27,501-518(2017)·Zbl 1391.62145号
[16] Hui,F.K.C。;华盛顿州沃顿。;Foster,S.D.,《使用惩罚回归混合模型的多物种分布建模》,《应用统计年鉴》,9866-882(2015)·Zbl 1397.62263号
[17] Hui,F.K.C。;华盛顿州沃顿。;Foster,S.D.,使用ERIC选择自适应套索的调谐参数,美国统计协会杂志,110,262-269(2015)·Zbl 1373.62370号
[18] Hui,F.K.C。;沃顿,D.I。;Ormerod,J.T。;Haapaniemi,V。;Taskinen,S.,广义线性潜在变量模型的变分近似,计算与图形统计杂志,26,35-43(2017)
[19] 易卜拉欣,J.G。;朱,H。;加西亚,R.I。;Guo,R.,混合效应模型中的固定效应和随机效应选择,生物统计学,67495-503(2011)·Zbl 1217.62171号
[20] Ivanova,A。;Molenberghs,G。;Verbeke,G.,《大型复杂有序数据的快速高效伪似然方法论》,《医学研究中的统计方法》,26,2758-2779(2015)
[21] 库兹涅佐娃,A。;布鲁恩,B.P。;Haubo,B.C.R.,lmerTest:线性混合效应模型的测试(2016)
[22] 利奇,L.S。;Olesen,S.C。;巴特沃思,P。;Poyser,C.,《新父亲身份与心理痛苦:澳大利亚男性的纵向研究》,《美国流行病学杂志》,180582-589(2014)
[23] Lin,B。;彭,Z。;Jiang,J.,通过REML和路径坐标优化选择固定和随机效应,计算与图形统计杂志,22,341-355(2013)
[24] Louis,T.A.,《使用EM算法时发现观测信息矩阵》,《皇家统计学会杂志》,44226-233(1982)·兹比尔0488.62018
[25] Mccullagh,P.,有序数据的回归模型,《皇家统计学会杂志》,第42期,第109-142页(1980年)·Zbl 0483.62056号
[26] Molenberghs,G。;Verbeke,G.,《离散纵向数据模型》(2006),纽约:Springer,纽约
[27] 缪勒,S。;Scealy,J.L。;Welsh,A.H.,线性混合模型中的模型选择,统计科学,28,135-167(2013)·Zbl 1331.62364号
[28] 缪勒,S。;Welsh,A.H.,《关于模型选择曲线》,《国际统计评论》,78240-256(2010)
[29] Powers,D.M.W.,《评估:从精确性、回忆性和F-测量到ROC》,《信息性、标记性和相关性》,《机器学习技术杂志》,第237-63页(2011年)
[30] 瓦林,C。;N.里德。;Firth,D.,《复合似然方法概述》,《统计》,2011年第21期,第5-42页·Zbl 05849508号
[31] 瓦林,C。;Vidoni,P.,关于复合似然推断和模型选择的注释,Biometrika,92519-528(2005)·Zbl 1183.62037号
[32] Vasdekis,V.G.S。;Rizopoulos,D。;Moustaki,I.,一类一般随机效应模型的加权成对似然估计,生物统计学,15677-689(2014)
[33] 韦贝克,G。;菲尤斯,S。;Molenberghs,G。;Davidian,M.,《多元纵向数据分析:综述》,《医学研究中的统计方法》,23,42-59(2014)
[34] Wang,H。;Leng,C.,通过最小二乘近似法进行统一LASSO估计,美国统计协会杂志,1021039-1048(2012)·Zbl 1306.62167号
[35] Watson,N。;Wooden,M.P.,《HILDA调查:设计和开发成功家庭小组调查、纵向和生命历程研究的案例研究》,3369-381(2012)
[36] 你,C。;缪勒,S。;Ormerod,J.T.,《广义自由度及其在线性混合模型选择、统计和计算中的应用》,26,199-210(2016)·Zbl 1342.62129号
[37] 赵,P。;罗查,G。;Yu,B.,分组和分级变量选择的复合绝对惩罚族,《统计年鉴》,373468-3497(2009)·Zbl 1369.62164号
[38] Zou,H.,《自适应套索及其Oracle属性》,《美国统计协会杂志》,第101期,第1418-1429页(2006年)·Zbl 1171.62326号
[39] 邹,H。;Li,R.,非关联惩罚似然模型中的一步稀疏估计,统计年鉴,361509-1533(2008)·Zbl 1142.62027号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。