×

通过惩罚混合logistic回归模型预测Nash。 (英语) Zbl 1477.62318号

小结:本文提出了一个合适且可解释的诊断统计模型,用于从近红外光谱数据预测非酒精性脂肪性肝炎(NASH)。在这种疾病中,未知患者的情况可能会导致不同的诊断。然后,该模型必须考虑数据的异质性和光谱数据的维度。
为此,我们建议根据诊断二进制变量和谱中选择的协变量的联合分布拟合混合模型。考虑惩罚最大似然估计。实际上,对回归系数和协方差参数都施加了双重惩罚。自动选择标准(如AIC和BIC)用于选择收缩量和簇数。通过仿真研究评估了整个程序的性能,并分析了其在NASH数据集上的应用。与竞争方法相比,该模型具有更好的预测性能,并提供了高度可解释的结果。

MSC公司:

62页第10页 统计学在生物学和医学中的应用;元分析
62J12型 广义线性模型(逻辑模型)
62平方米 随机过程推断和预测
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ahonen,I.、Nevalainen,J.和Larocque,D.(2019年)。使用灵活的有限回归混合进行预测。计算。统计师。数据分析。132 212-224. ·兹比尔1507.62004 ·doi:10.1016/j.csda.2018.01.012
[2] Anty,R.、Iannelli,A.、Patouraux,S.、Bonnafous,S.,Lavallard,V.、Senni-Buratti,M.、Ben-Amor,I.、Staccini-Myx,A.、Saint-Paul,M.C.等人(2010年)。包括代谢综合征、丙氨酸氨基转移酶和细胞角蛋白-18的新型复合模型用于诊断病态肥胖患者的非酒精性脂肪性肝炎。Aliment公司。药理学。疗法。32 1315-1322.
[3] Biernacki,C.、Celeux,G.和Govaert,G.(2000)。用综合完全似然法评估用于聚类的混合模型。IEEE传输。模式分析。机器。智力。22 719-725.
[4] Biernacki,C.、Celeux,G.和Govaert,G.(2003年)。为EM算法选择初始值,以获得多元高斯混合模型中的最大似然。计算。统计师。数据分析。41 561-575. ·Zbl 1429.62235号 ·doi:10.1016/S0167-9473(02)00163-9
[5] Bougeard,S.、Abdi,H.、Saporta,G.和Niang,N.(2018年)。多块组件方法的聚类分析。高级数据分析。分类。12 285-313. ·Zbl 1414.62231号 ·doi:10.1007/s11634-017-0296-8
[6] Breslow,N.E.(1996年)。流行病学统计:病例对照研究。J.Amer。统计师。协会。91 14-28. ·Zbl 0870.62082号 ·doi:10.2307/2291379
[7] Dempster,A.P.、Laird,N.M.和Rubin,D.B.(1977年)。通过EM算法从不完整数据中获得最大似然。J.罗伊。统计师。Soc.序列号。B类39 1-38. 经过讨论·Zbl 0364.62022号
[8] Fan,J.和Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。J.Amer。统计师。协会。96 1348-1360. ·兹比尔1073.62547 ·doi:10.1198/016214501753382273
[9] Friedman,J.、Hastie,T.和Tibshirani,R.(2008)。用图形套索进行稀疏逆协方差估计。生物统计学9 432-441. ·Zbl 1143.62076号
[10] Green,P.J.(1990)。关于EM算法用于惩罚似然估计的使用。J.罗伊。统计师。Soc.序列号。B类52 443-452. ·Zbl 0706.62022号
[11] Grün,B.和Leisch,F.(2007年)。拟合(R)中广义线性回归的有限混合。计算。统计师。数据分析。51 5247-5252. ·Zbl 1445.62192号 ·doi:10.1016/j.csda.2006.08.014
[12] Hastie,T.、Tibshirani,R.和Wainwright,M.(2015)。稀疏的统计学习:拉索和推广.统计学和应用概率论专著143.CRC出版社,佛罗里达州博卡拉顿·Zbl 1319.68003号
[13] Hoshikawa,T.(2013)。观测数据的混合回归,应用于函数回归模型。网址:http://arxiv.org/abs/1307.0170。
[14] Jacobs,R.A.、Jordan,M.I.、Nowlan,S.J.和Hinton,G.E.(1991)。当地专家的适应性混合。神经计算。3 79-87.
[15] Jiang,Y.、Conglian,Y.and Qinghua,J.(2018)。专家模型局部混合的模型选择。J.应用。斯达。45 1994-2006. ·Zbl 1516.62364号 ·doi:10.1080/02664763.2017.1405914
[16] Keribin,C.(2000年)。混合模型阶数的一致估计。SankhyáSer。A类62 49-66. ·Zbl 1081.62516号
[17] Khalili,A.和Chen,J.(2007年)。回归模型有限混合中的变量选择。J.Amer。统计师。协会。102 1025-1038. ·Zbl 1469.62306号 ·doi:10.1198/0162145000000590
[18] Khalili,A.和Lin,S.(2013)。参数发散数回归模型的有限混合正则化。生物计量学69 436-446. ·Zbl 1273.62254号 ·doi:10.111/生物量12020
[19] Lloyd Jones,L.R.、Nguyen,H.D.和McLachlan,G.J.(2018)。线性回归模型的拉索惩罚混合模型的全局收敛算法。计算。统计师。数据分析。119 19-38. ·Zbl 1469.62109号 ·doi:10.1016/j.csda.2017.09.003
[20] MacQueen,J.(1967)。多元观测值分类和分析的一些方法。程序。伯克利第五交响乐团。数学。统计师。和概率(加州伯克利., 1965/66) 281-297. 加利福尼亚大学出版社,加利福尼亚州伯克利·Zbl 0214.46201号
[21] McLachlan,G.和Peel,D.(2000年)。有限混合模型.概率统计中的威利级数:应用概率统计Wiley Interscience,纽约·Zbl 0963.62061号 ·doi:10.1002/0471721182
[22] Meng,X.-L.和Rubin,D.B.(1993)。通过ECM算法的最大似然估计:一般框架。生物特征80 267-278. ·Zbl 0778.62022号 ·doi:10.1093/biomet/80.2.267
[23] Misiti,M.、Misiti、Y.、Poggi,J.-M.和Portier,B.(2015)。法国诺曼底高级区短期pm10预测的混合线性回归模型。CS-BIGS公司6 47-60.
[24] Morvan,M.、Devijver,E.、Giacofci,M.和Monbet,V.(2021年)。补充“通过logistic回归模型的惩罚混合预测NASH”https://doi.org/10.1214/20-AOAS1409SUPP网站
[25] Ross,J.和Dy,J.(2013)。带约束的高斯过程的非参数混合。程序. 30第次国际会议机。学习。28 1346-1354.
[26] Rosset,S.和Tibshirani,R.J.(2020年)。从Fixed-X到Random-X回归:偏差-方差分解、协方差惩罚和预测误差估计。J.Amer。统计师。协会。115 138-151. ·兹比尔1437.62351 ·doi:10.1080/016214592018.1424632
[27] Schwarz,G.(1978年)。估算模型的维度。安。统计师。6 461-464. ·Zbl 0379.62005年
[28] Shmueli,G.(2010年)。解释还是预测?统计师。科学。25 289-310. ·Zbl 1329.62045号 ·doi:10.1214/10-STS330
[29] Städler,N.、Bühlmann,P.和van de Geer,S.(2010年)\混合回归模型的[{\ell1}\]-惩罚。测试19 209-256. ·兹比尔1203.62128 ·doi:10.1007/s11749-010-0197-z
[30] Tibshirani,R.(1996)。通过套索回归收缩和选择。J.罗伊。统计师。Soc.序列号。B类58 267-288. ·Zbl 0850.62538号
[31] Vinh,N.X.、Epps,J.和Bailey,J.(2010)。聚类比较的信息论度量:变量、属性、归一化和机会修正。J.马赫。学习。物件。11 2837-2854. ·Zbl 1242.62062号
[32] Wang,H.,Li,R.和Tsai,C.-L.(2007)。调整平滑剪裁绝对偏差方法的参数选择器。生物特征94 553-568. ·Zbl 1135.62058号 ·doi:10.1093/biomet/asm053
[33] Xu,L.、Jordan,M.I.和Hinton,G.E.(1995)。混合专家的替代模型。神经信息处理系统研究进展633-640.
[34] Younossi,Z.、Anstee,Q.M.、Marietti,M.、Hardy,T.、Henry,L.、Eslam,M.,George,J.和Bugianesi,E.(2018a)。nafld和nash的全球负担:趋势、预测、风险因素和预防。Nature Reviews胃肠病学和肝病学15 11-20.
[35] Younossi,Z.,Loomba,R.,Anstee,Q.,Rinella,M.,Bugianesi,E.,Marchesini,G.,Neuschwander-Tetri,B.,Serfaty,L.,Negro,F.等人(2018b)。非酒精性脂肪性肝病、非酒精性肝炎和相关纤维化的诊断方法。肝病学68 349-360.
[36] Yuksel,S.E.、Wilson,J.N.和Gader,P.D.(2012年)。二十年的专家组合。IEEE传输。神经网络。学习。系统。23 1177-1193 ·doi:10.1109/TNNLS.2012.200299
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。