文件Zbl 07782051-zbMATH打开

具有重复测量的部分线性混合效应模型的插入式机器学习。（英语） Zbl 07782051号

扫描。J.统计。 50，编号4，1553-1567（2023）。

概述：传统上，结合参数估计，使用样条或核方法推断部分线性混合效应模型中的线性系数（固定效应），以进行重复测量。使用机器学习算法，我们可以合并复杂的交互结构、非光滑项和高维变量。对于非线性变量，对线性变量和响应进行非参数调整，这些调整变量满足线性混合效应模型，其中线性系数可以用标准线性混合效应方法估计。我们证明了估计的固定效应系数以参数速率收敛，是渐近高斯分布的，并且是半参数有效的。两个仿真研究表明，我们的方法在覆盖率方面优于惩罚回归样条方法。我们还在HIV感染者的纵向数据集上说明了我们提出的方法。我们方法的软件代码可在R（右）-包装dmlalg公司。
©2023作者。斯堪的纳维亚统计杂志由John Wiley&Sons Ltd代表《斯堪的纳维亚统计杂志》基金会董事会出版。

MSC公司：

62至XX

统计

关键词：

软件：

mgcv公司;R（右）;jmcm公司;CRAN（起重机）;游戏4;dmlalg公司

PDF格式 BibTeX公司 XML格式引用

全文：内政部 arXiv公司

OA许可证

参考文献：

[1]	Aniley，T.T.、Debusho，L.K.、Nigusie，Z.M.、Yimer，W.K.和Yimer、B.B.（2019年）。成人糖尿病患者纵向测量空腹血糖水平的半参数混合模型。BMC医学研究方法，19，13。
[2]	Belloni，A.、Chen，D.、Chernozhukov，V.和Hansen，C.（2012年）。最优仪器的稀疏模型和方法及其在征用领域的应用。《计量经济学》，80，2369-2429·Zbl 1274.62464号
[3]	Belloni，A.和Chernozhukov，V.（2011年）。高维稀疏模型中的l1惩罚分位数回归。《统计年鉴》，39，82-130·Zbl 1209.62064号
[4]	Belloni，A.和Chernozhukov，V.（2013）。高维稀疏模型中模型选择后的最小二乘法。伯努利，19，521-547·Zbl 1456.62066号
[5]	Belloni，A.、Chernozhukov，V.和Wang，L.（2011年）。平方根套索：通过圆锥规划对稀疏信号进行关键恢复。生物特征，98，791-806·Zbl 1228.62083号
[6]	Bickel，P.J.、Ritov，Y.和Tsybakov，A.B.（2009年）。lasso和Dantzig选择器的同时分析。《统计年鉴》，第37期，1705-1732页·Zbl 1173.62022号
[7]	Bondell，H.D.、Krishna，A.和Ghosh，S.K.（2010年）。线性混合效应模型中固定效应和随机效应的联合变量选择。生物统计学，661069-1077·Zbl 1233.62134号
[8]	Bradic，J.、Claeskens，G.和Gueuning，T.（2020年）。高维线性混合模型中的固定效应测试。《美国统计协会杂志》，第115期，1835-1850页·Zbl 1452.62491号
[9]	Breiman，L.（2001）。随机森林。机器学习，45，5-32·Zbl 1007.68152号
[10]	Bühlmann，P.和van deGeer，S.（2011）。高维数据统计：方法、理论和应用。斯普林格·Zbl 1273.62015年
[11]	Chen，L.，&Cao，H.（2017）。用部分线性模型分析异步纵向数据。《电子统计杂志》，第11期，1549-1569页·Zbl 1362.62066号
[12]	Chen，X.和White，H.（1999）。非参数神经网络估计量的改进率和渐近正态性。IEEE信息理论汇刊，45，682-691·兹比尔1098.92502
[13]	Chernozhukov，V.、Chetverikov，D.、Demirer，M.、Duflo，E.、Hansen，C.、Newey，W.和Robins，J.（2018年）。用于治疗和结构参数的双/脱苦机器学习。《计量经济学杂志》，21，C1-C68·Zbl 07565928号
[14]	Davidian，M.和Giltinan，D.M.（1995）。重复测量数据的非线性模型，统计学和应用概率专著第62卷。查普曼和霍尔/CRC。
[15]	Davidian，M.和Giltinan，D.M.（2003）。重复测量数据的非线性模型：概述和更新。农业、生物和环境统计杂志，8387-419。
[16]	Davis，C.S.（2002）。重复测量分析的统计方法。施普林格的统计学文本。斯普林格·Zbl 0985.6202号
[17]	Demidenko，E.（2004）。混合模型：理论与应用。John Wiley&Sons有限公司·Zbl 1055.62086号
[18]	Emmenegger，C.（2021）。dmlalg：双机器学习算法。CRAN上提供R‐包。检索自。https://cran.r网址‐项目.org/web/packages/dmlalg/index.html
[19]	Fahrmeir，L.和Kneib，T.（2011）。纵向、空间和事件历史数据的贝叶斯平滑和回归（第36卷）。牛津大学出版社·Zbl 1249.62003号
[20]	Fan，J.和Zhang，J.‐T。(2000). 应用于纵向数据的函数线性模型的两步估计。英国皇家统计学会杂志，B辑：统计方法，62303-322。
[21]	Fitzmaurice，G.M.、Laird，N.M.和Ware，J.H.（2011年）。应用纵向分析（第二版）。威利·Zbl 1226.62069号
[22]	郭友庆，&中毅，Z.（2008）。纵向数据的部分线性混合模型中的鲁棒估计。《数学科学学报》，28，333-347·Zbl 1164.62008年
[23]	Hart，J.D.和Wehrly，T.E.（1986年）。使用重复测量数据的核回归估计。美国统计协会杂志，811080-1088·Zbl 0635.62030号
[24]	Ibrahim，J.G.、Zhu，H.、Garcia，R.I.和Guo，R.（2011）。混合效应模型中的固定效应和随机效应选择。生物计量学，67495-503·Zbl 1217.62171号
[25]	Kim，S.、Zeng，D.和Taylor，J.M.G.（2017）。纵向数据的联合部分线性模型和信息缺失。生物计量学，73，72-82·Zbl 1366.62223号
[26]	Kozbur，D.（2020年）。基于测试的正向模型选择分析。《计量经济学》，88，2147-2173·Zbl 1467.62040号
[27]	Laird，N.M.和Ware，J.H.（1982年）。纵向数据的随机效应模型。生物统计学，38963-974·Zbl 0512.62107号
[28]	Li，S.、Cai，T.T.和Li，H.（2021）。高维线性混合效应模型的推断：准似然方法。美国统计协会杂志。117, 1835-1846. ·Zbl 1515.62076号
[29]	Li，Z.，&Zhu，L.（2010）。纵向数据半参数混合模型中的方差分量。《斯堪的纳维亚统计杂志》，37，442-457·Zbl 1226.62041号
[30]	Liang，H.（2009）。广义部分线性混合效应模型包含了测量错误的协变量。统计数学研究所年鉴，61，27-46·Zbl 1294.62147号
[31]	Lin，H.、Qin，G.、Zhang，J.和Fung，W.K.（2018年）。纵向数据部分线性模型的双稳健估计，协变量中有缺失和测量误差。统计学，52，84-98·Zbl 1390.62133号
[32]	Lin，X.和Carroll，R.（2001）。使用广义估计方程进行聚类数据的半参数回归。美国统计协会杂志，96，1045-1056·Zbl 1072.62566号
[33]	吕涛（2016）。艾滋病临床研究的斜t部分线性混合效应模型。生物制药统计杂志，26899-911。
[34]	Luo，Y.和Spindler，M.（2016）。高维度 [（{l} _2增强：收敛速度。预印arXiv:1602.08927。
[35]	Mammen，E.和van deGeer，S.（1997年）。部分线性模型中的惩罚拟似然估计。统计年鉴，251014-1035·Zbl 0906.62033号
[36]	Masci，C.、Paganoni，A.M.和Ieva，F.（2019年）。意大利学校无监督分类的半参数混合效应模型。英国皇家统计学会杂志：A辑（社会统计），1821313-1342。
[37]	Ohinata，R.（2012）。关于半参数回归应用的三篇论文：部分线性混合效应模型和指数模型（博士论文）。哥廷根大学（Universityät Göttingen）的Wirtschaftswissenschaftlichen Fakultät der。
[38]	Pan，J.和Pan，Y.（2017年）。Jmcm：纵向数据联合平均协方差建模的R包。统计软件杂志，82，1-29。
[39]	Pinheiro，J.C.（1994）。威斯康星大学混合效应模型专题（博士论文）。
[40]	Pinheiro，J.C.和Bates，D.M.（2000）。S和S‐PLUS中的混合效应模型。统计和计算。斯普林格·Zbl 0953.62065号
[41]	Qin，G.，&Zhu，Z.（2007）。纵向数据广义半参数混合模型的稳健估计。多元分析杂志，981658-1683·Zbl 1122.62029号
[42]	Qin，G.Y.Q.和Zhu，Z.Y.（2009）。纵向数据广义偏线性混合模型中的鲁棒最大似然估计。生物统计学，65，52-59·Zbl 1159.62080号
[43]	R核心团队。(2021). R：用于统计计算的语言和环境。R统计计算基金会。https://www.R‐项目.org/
[44]	Rice，J.A.和Silverman，B.W.（1991）。当数据是曲线时，以非帧方式估计均值和协方差结构。英国皇家统计学会期刊B辑（方法学），53233-243·Zbl 0800.62214号
[45]	Schelldorfer，J.、Bühlmann，P.和van deGeer，S.（2011）。使用高维线性混合效应模型的估计 [（{\ell}_1\]\）-处罚。《斯堪的纳维亚统计杂志》，38，197-214·Zbl 1246.62161号
[46]	Taavoni，M.和Arashi，M.（2021a）。纵向数据的高维广义半参数模型。统计学，55831-850·Zbl 07464105号
[47]	Taavoni，M.和Arashi，M.（2021b）。半参数混合效应纵向建模中的核估计。统计论文，621095-1116·Zbl 1477.62320号
[48]	Taavoni，M.、Arashi，M.和Wang，W.L林，T.‐I。(2021). 多变量具有多重特征的纵向数据的半参数混合效应模型。统计计算与模拟杂志，91，260-281·Zbl 07480656号
[49]	Tang，Y.、Sinha，D.和Pati，D.（2015）。倾斜纵向数据的贝叶斯部分线性模型。生物统计学，16，441-453。
[50]	Tibshirani，R.（1996）。通过套索回归收缩和选择。英国皇家统计学会杂志：B辑：方法论，58267-288·Zbl 0850.62538号
[51]	Verbeke，G.和Molenberghs，G.（2000年）。纵向数据的线性混合模型。统计学中的施普林格系列。斯普林格·Zbl 0956.62055号
[52]	Vonesh，E.F.和Chinchilli，V.M.（1997）。重复测量分析的线性和非线性模型（第154卷）。查普曼和霍尔/CRC·Zbl 0893.62077号
[53]	Wager，S.和Walther，G.（2016年）。回归树的自适应集中，适用于随机森林。预印arXiv:153.06388。
[54]	Wang，N.、Carroll，R.J.和Lin，X.（2005）。纵向/聚类数据的有效半参数边际估计。美国统计协会杂志，100147-157·Zbl 1117.62440号
[55]	Wood，S.和Scheipl，F.（2020年）。gamm4：使用“mgcv”和“lme4”的广义加性混合模型。R包版本0.2-6。检索自。https://CRAN.R‐project.org/package=gamm4
[56]	Zeger，S.L.和Diggle，P.J.（1994年）。HIV血清转化者CD4细胞数量纵向数据的半参数模型。生物统计学，50689-699·Zbl 0821.62093号
[57]	Zhang，D.（2004）。纵向数据的变系数广义线性混合模型。生物统计学，60，8-15·Zbl 1130.62350号
[58]	Zhang，D.，Lin，X.，Raz，J.，&Sowers，M.（1998）。纵向数据的半参数随机混合模型。美国统计协会杂志，93，710-719·Zbl 0918.62039号
[59]	Zhang，J.，&Xue，L.（2020年）。具有纵向数据的广义部分线性模型的变量选择。进化情报，152473-2483。

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
！ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

字段

操作员

具有重复测量的部分线性混合效应模型的插入式机器学习。（英语） Zbl 07782051号

MSC公司：

关键词：

软件：

参考文献：

示例

字段

操作员

具有重复测量的部分线性混合效应模型的插入式机器学习。 （英语） Zbl 07782051号

MSC公司：

关键词：

软件：

参考文献：

具有重复测量的部分线性混合效应模型的插入式机器学习。（英语） Zbl 07782051号