×

具有重复测量的部分线性混合效应模型的插入式机器学习。 (英语) Zbl 07782051号

概述:传统上,结合参数估计,使用样条或核方法推断部分线性混合效应模型中的线性系数(固定效应),以进行重复测量。使用机器学习算法,我们可以合并复杂的交互结构、非光滑项和高维变量。对于非线性变量,对线性变量和响应进行非参数调整,这些调整变量满足线性混合效应模型,其中线性系数可以用标准线性混合效应方法估计。我们证明了估计的固定效应系数以参数速率收敛,是渐近高斯分布的,并且是半参数有效的。两个仿真研究表明,我们的方法在覆盖率方面优于惩罚回归样条方法。我们还在HIV感染者的纵向数据集上说明了我们提出的方法。我们方法的软件代码可在R(右)-包装dmlalg公司
©2023作者。斯堪的纳维亚统计杂志由John Wiley&Sons Ltd代表《斯堪的纳维亚统计杂志》基金会董事会出版。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aniley,T.T.、Debusho,L.K.、Nigusie,Z.M.、Yimer,W.K.和Yimer、B.B.(2019年)。成人糖尿病患者纵向测量空腹血糖水平的半参数混合模型。BMC医学研究方法,19,13。
[2] Belloni,A.、Chen,D.、Chernozhukov,V.和Hansen,C.(2012年)。最优仪器的稀疏模型和方法及其在征用领域的应用。《计量经济学》,80,2369-2429·Zbl 1274.62464号
[3] Belloni,A.和Chernozhukov,V.(2011年)。高维稀疏模型中的l1惩罚分位数回归。《统计年鉴》,39,82-130·Zbl 1209.62064号
[4] Belloni,A.和Chernozhukov,V.(2013)。高维稀疏模型中模型选择后的最小二乘法。伯努利,19,521-547·Zbl 1456.62066号
[5] Belloni,A.、Chernozhukov,V.和Wang,L.(2011年)。平方根套索:通过圆锥规划对稀疏信号进行关键恢复。生物特征,98,791-806·Zbl 1228.62083号
[6] Bickel,P.J.、Ritov,Y.和Tsybakov,A.B.(2009年)。lasso和Dantzig选择器的同时分析。《统计年鉴》,第37期,1705-1732页·Zbl 1173.62022号
[7] Bondell,H.D.、Krishna,A.和Ghosh,S.K.(2010年)。线性混合效应模型中固定效应和随机效应的联合变量选择。生物统计学,661069-1077·Zbl 1233.62134号
[8] Bradic,J.、Claeskens,G.和Gueuning,T.(2020年)。高维线性混合模型中的固定效应测试。《美国统计协会杂志》,第115期,1835-1850页·Zbl 1452.62491号
[9] Breiman,L.(2001)。随机森林。机器学习,45,5-32·Zbl 1007.68152号
[10] Bühlmann,P.和van deGeer,S.(2011)。高维数据统计:方法、理论和应用。斯普林格·Zbl 1273.62015年
[11] Chen,L.,&Cao,H.(2017)。用部分线性模型分析异步纵向数据。《电子统计杂志》,第11期,1549-1569页·Zbl 1362.62066号
[12] Chen,X.和White,H.(1999)。非参数神经网络估计量的改进率和渐近正态性。IEEE信息理论汇刊,45,682-691·兹比尔1098.92502
[13] Chernozhukov,V.、Chetverikov,D.、Demirer,M.、Duflo,E.、Hansen,C.、Newey,W.和Robins,J.(2018年)。用于治疗和结构参数的双/脱苦机器学习。《计量经济学杂志》,21,C1-C68·Zbl 07565928号
[14] Davidian,M.和Giltinan,D.M.(1995)。重复测量数据的非线性模型,统计学和应用概率专著第62卷。查普曼和霍尔/CRC。
[15] Davidian,M.和Giltinan,D.M.(2003)。重复测量数据的非线性模型:概述和更新。农业、生物和环境统计杂志,8387-419。
[16] Davis,C.S.(2002)。重复测量分析的统计方法。施普林格的统计学文本。斯普林格·Zbl 0985.6202号
[17] Demidenko,E.(2004)。混合模型:理论与应用。John Wiley&Sons有限公司·Zbl 1055.62086号
[18] Emmenegger,C.(2021)。dmlalg:双机器学习算法。CRAN上提供R‐包。检索自。https://cran.r网址‐项目.org/web/packages/dmlalg/index.html
[19] Fahrmeir,L.和Kneib,T.(2011)。纵向、空间和事件历史数据的贝叶斯平滑和回归(第36卷)。牛津大学出版社·Zbl 1249.62003号
[20] Fan,J.和Zhang,J.‐T。(2000). 应用于纵向数据的函数线性模型的两步估计。英国皇家统计学会杂志,B辑:统计方法,62303-322。
[21] Fitzmaurice,G.M.、Laird,N.M.和Ware,J.H.(2011年)。应用纵向分析(第二版)。威利·Zbl 1226.62069号
[22] 郭友庆,&中毅,Z.(2008)。纵向数据的部分线性混合模型中的鲁棒估计。《数学科学学报》,28,333-347·Zbl 1164.62008年
[23] Hart,J.D.和Wehrly,T.E.(1986年)。使用重复测量数据的核回归估计。美国统计协会杂志,811080-1088·Zbl 0635.62030号
[24] Ibrahim,J.G.、Zhu,H.、Garcia,R.I.和Guo,R.(2011)。混合效应模型中的固定效应和随机效应选择。生物计量学,67495-503·Zbl 1217.62171号
[25] Kim,S.、Zeng,D.和Taylor,J.M.G.(2017)。纵向数据的联合部分线性模型和信息缺失。生物计量学,73,72-82·Zbl 1366.62223号
[26] Kozbur,D.(2020年)。基于测试的正向模型选择分析。《计量经济学》,88,2147-2173·Zbl 1467.62040号
[27] Laird,N.M.和Ware,J.H.(1982年)。纵向数据的随机效应模型。生物统计学,38963-974·Zbl 0512.62107号
[28] Li,S.、Cai,T.T.和Li,H.(2021)。高维线性混合效应模型的推断:准似然方法。美国统计协会杂志。117, 1835-1846. ·Zbl 1515.62076号
[29] Li,Z.,&Zhu,L.(2010)。纵向数据半参数混合模型中的方差分量。《斯堪的纳维亚统计杂志》,37,442-457·Zbl 1226.62041号
[30] Liang,H.(2009)。广义部分线性混合效应模型包含了测量错误的协变量。统计数学研究所年鉴,61,27-46·Zbl 1294.62147号
[31] Lin,H.、Qin,G.、Zhang,J.和Fung,W.K.(2018年)。纵向数据部分线性模型的双稳健估计,协变量中有缺失和测量误差。统计学,52,84-98·Zbl 1390.62133号
[32] Lin,X.和Carroll,R.(2001)。使用广义估计方程进行聚类数据的半参数回归。美国统计协会杂志,96,1045-1056·Zbl 1072.62566号
[33] 吕涛(2016)。艾滋病临床研究的斜t部分线性混合效应模型。生物制药统计杂志,26899-911。
[34] Luo,Y.和Spindler,M.(2016)。高维度
[({l} _2增强:收敛速度。预印arXiv:1602.08927。
[35] Mammen,E.和van deGeer,S.(1997年)。部分线性模型中的惩罚拟似然估计。统计年鉴,251014-1035·Zbl 0906.62033号
[36] Masci,C.、Paganoni,A.M.和Ieva,F.(2019年)。意大利学校无监督分类的半参数混合效应模型。英国皇家统计学会杂志:A辑(社会统计),1821313-1342。
[37] Ohinata,R.(2012)。关于半参数回归应用的三篇论文:部分线性混合效应模型和指数模型(博士论文)。哥廷根大学(Universityät Göttingen)的Wirtschaftswissenschaftlichen Fakultät der。
[38] Pan,J.和Pan,Y.(2017年)。Jmcm:纵向数据联合平均协方差建模的R包。统计软件杂志,82,1-29。
[39] Pinheiro,J.C.(1994)。威斯康星大学混合效应模型专题(博士论文)。
[40] Pinheiro,J.C.和Bates,D.M.(2000)。S和S‐PLUS中的混合效应模型。统计和计算。斯普林格·Zbl 0953.62065号
[41] Qin,G.,&Zhu,Z.(2007)。纵向数据广义半参数混合模型的稳健估计。多元分析杂志,981658-1683·Zbl 1122.62029号
[42] Qin,G.Y.Q.和Zhu,Z.Y.(2009)。纵向数据广义偏线性混合模型中的鲁棒最大似然估计。生物统计学,65,52-59·Zbl 1159.62080号
[43] R核心团队。(2021). R: 用于统计计算的语言和环境。R统计计算基金会。https://www.R‐项目.org/
[44] Rice,J.A.和Silverman,B.W.(1991)。当数据是曲线时,以非帧方式估计均值和协方差结构。英国皇家统计学会期刊B辑(方法学),53233-243·Zbl 0800.62214号
[45] Schelldorfer,J.、Bühlmann,P.和van deGeer,S.(2011)。使用高维线性混合效应模型的估计
[({\ell}_1\]\)-处罚。《斯堪的纳维亚统计杂志》,38,197-214·Zbl 1246.62161号
[46] Taavoni,M.和Arashi,M.(2021a)。纵向数据的高维广义半参数模型。统计学,55831-850·Zbl 07464105号
[47] Taavoni,M.和Arashi,M.(2021b)。半参数混合效应纵向建模中的核估计。统计论文,621095-1116·Zbl 1477.62320号
[48] Taavoni,M.、Arashi,M.和Wang,W.L林,T.‐I。(2021). 多变量
具有多重特征的纵向数据的半参数混合效应模型。统计计算与模拟杂志,91,260-281·Zbl 07480656号
[49] Tang,Y.、Sinha,D.和Pati,D.(2015)。倾斜纵向数据的贝叶斯部分线性模型。生物统计学,16,441-453。
[50] Tibshirani,R.(1996)。通过套索回归收缩和选择。英国皇家统计学会杂志:B辑:方法论,58267-288·Zbl 0850.62538号
[51] Verbeke,G.和Molenberghs,G.(2000年)。纵向数据的线性混合模型。统计学中的施普林格系列。斯普林格·Zbl 0956.62055号
[52] Vonesh,E.F.和Chinchilli,V.M.(1997)。重复测量分析的线性和非线性模型(第154卷)。查普曼和霍尔/CRC·Zbl 0893.62077号
[53] Wager,S.和Walther,G.(2016年)。回归树的自适应集中,适用于随机森林。预印arXiv:153.06388。
[54] Wang,N.、Carroll,R.J.和Lin,X.(2005)。纵向/聚类数据的有效半参数边际估计。美国统计协会杂志,100147-157·Zbl 1117.62440号
[55] Wood,S.和Scheipl,F.(2020年)。gamm4:使用“mgcv”和“lme4”的广义加性混合模型。R包版本0.2-6。检索自。https://CRAN.R‐project.org/package=gamm4
[56] Zeger,S.L.和Diggle,P.J.(1994年)。HIV血清转化者CD4细胞数量纵向数据的半参数模型。生物统计学,50689-699·Zbl 0821.62093号
[57] Zhang,D.(2004)。纵向数据的变系数广义线性混合模型。生物统计学,60,8-15·Zbl 1130.62350号
[58] Zhang,D.,Lin,X.,Raz,J.,&Sowers,M.(1998)。纵向数据的半参数随机混合模型。美国统计协会杂志,93,710-719·Zbl 0918.62039号
[59] Zhang,J.,&Xue,L.(2020年)。具有纵向数据的广义部分线性模型的变量选择。进化情报,152473-2483。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。