×

扩展具有伴随协变量的(t)线性混合效应模型的有限混合。 (英语) 兹比尔1510.62286

摘要:基于模型的纵向数据聚类问题在过去二十年中引起了越来越多的关注。为了实现这一任务,特别是当数据包含极端观测值时,考虑了Student(t)线性混合效应(FM-tLME)模型的有限混合。本文提出了一种扩展的Student(t)线性混合效应有限混合模型(EFM-tLME),其中类别成分标签被假定受观测协变量的影响。与假设混合比例固定但未知的朴素方法相比,所提出的EFM-tLME模型利用logistic函数来连接先验分类概率和相关协变量之间的关系。为了实现最大似然估计,在几种模型简化方案下,提出了交替期望条件最大化(AECM)算法。还研究了提取参数估计的基于信息的标准误差的技术。通过仿真实验和一项艾滋病临床研究的实际数据,对该方法进行了说明。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
10层62层 点估计
62页第10页 统计学在生物学和医学中的应用;元分析
62-08 统计问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Akaike,H.,《信息理论与最大似然原理的扩展》(Petrov,B.N.;Csaki,F.,《第二届信息理论国际研讨会论文集》(1973),Akademiai Kiado:Akademiai Kiad Budapest),267-281·Zbl 0283.62006号
[2] 安德鲁斯,J.L。;McNicholas,P.D.,《多元因子分析仪的扩展混合》,统计计算。,21, 3, 361-373 (2011) ·Zbl 1255.62171号
[3] 安德鲁斯,J.L。;McNicholas,P.D.,用于基于模型的聚类、分类和判别分析的修正因子分析混合,J.Statist。计划。推理,141,41479-1486(2011)·Zbl 1204.62098号
[4] 安德鲁斯,J.L。;Mcnicholas,P.D.,基于模型的聚类、分类和通过多元分布混合的判别分析,统计计算。,22, 5, 1021-1029 (2012) ·Zbl 1252.62062号
[5] 阿扎里尼,A。;Capitaino,A.,《对称扰动产生的分布,强调多元斜(t)分布》,J.R.Stat.Soc.Ser。B统计方法。,65, 367-389 (2003) ·Zbl 1065.62094号
[6] 巴格纳托,L。;Punzo,A。;Zoia,M.G.,《多元轻量级正态分布及其在基于模型聚类中的应用》,加拿大。J.统计。,45, 1, 95-119 (2017) ·Zbl 1462.62308号
[7] Bai,X。;Chen,K。;Yao,W.,使用多元(t)分布的线性混合模型的混合,J.Stat.Compute。模拟。,86, 771-787 (2016) ·Zbl 1510.62272号
[8] Barndorff-Nielsen,O.,指数族混合物的可辨识性,J.Math。分析。申请。,12, 115-121 (1965) ·Zbl 0138.12105号
[9] Booth,J.G。;卡塞拉,G。;Hobert,J.P.,《使用目标函数和随机搜索的聚类》,J.R.Stat.Soc.Ser。B统计方法。,70, 119-139 (2008) ·Zbl 1400.62128号
[10] Celeux,G。;O·马丁。;Lavergne,C.,从重复微阵列实验中聚类基因表达谱的线性混合模型混合,统计模型。,5, 243-267 (2005) ·Zbl 1111.62103号
[11] De la Cruz-Mesía,R。;F.A.金塔纳。;Marshall,G.,纵向数据的基于模型的聚类,计算。统计师。数据分析。,52, 1441-1457 (2008) ·Zbl 1452.62454号
[12] Dang,U.J。;Browne,R.P。;McNicholas,P.D.,多元幂指数分布的混合,生物统计学,71,4,1081-1089(2015)·Zbl 1419.62330号
[13] Dayton,C.M。;Macready,G.B.,《伴随变量潜在类模型》,J.Amer。统计师。协会,83,401,173-178(1988)
[14] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,《通过EM算法从不完整数据中进行最大似然估计》(带讨论),J.R.Stat.Soc.Ser。B统计方法。,39, 1-38 (1977) ·Zbl 0364.62022号
[15] Fokoué,E.,《因子分析仪的混合物:协变量的扩展》,《多元分析杂志》。,95, 370-384 (2005) ·Zbl 1070.62050
[16] 弗雷利,C。;Raftery,A.E.,多少簇?哪种聚类方法?答案通过基于模型的聚类分析,计算。J.,41,578-588(1998)·Zbl 0920.68038号
[17] 弗雷利,C。;Raftery,A.E.,基于模型的聚类、判别分析和密度估计,J.Amer。统计师。协会,97,611-612(2002)·Zbl 1073.62545号
[18] Frühwirth-Schnatter,S.,有限混合和马尔可夫转换模型(2006),Springer:Springer纽约·Zbl 1108.6202号
[19] Gaffney,S.J.,Smyth,P.,2003年。随机效应回归混合曲线聚类。摘自:Bishop,C.M.Frey,B.J.(编辑),《第九届人工智能与统计国际研讨会论文集》。佛罗里达州基韦斯特。
[20] 加西亚·埃斯库德罗,洛杉矶。;Gordaliza,A。;马特兰,C。;Mayo-Iscar,A.,《稳健聚类方法综述》,《高级数据分析》。分类。,4, 89-109 (2010) ·Zbl 1284.62375号
[21] Gershenfeld,N.,《非线性推理和聚类加权建模》,纽约科学院。科学。,808, 1, 18-24 (1997)
[22] Grün,B。;Leisch,F.,广义线性回归模型的有限混合,(线性模型和相关领域的最新进展(2008),Physica-Verlag HD),205-230
[23] 郭世伟。;Thompson,E.A.,大型复杂谱系混合模型的蒙特卡罗估计,生物计量学,50417-432(1994)·Zbl 0821.62075号
[24] 霍尔,D.B。;Wang,L.,聚类相关数据广义线性混合效应模型的两组分混合,统计模型。,5, 21-37 (2005) ·Zbl 1070.62059号
[25] 锤子,S.M。;Squires,K.E。;医学博士休斯。;格里姆斯,J.M。;德米特,L.M。;柯里尔,J.S。;埃隆·J·J。;范伯格,J.E。;Balfour,H.H。;戴顿,L.R。;乔达凯维茨,J.A。;Fischl,M.A.,《两种核苷类似物加吲哚那韦治疗人类免疫缺陷病毒感染和CD4细胞计数小于等于200个/立方毫米的患者的对照试验》,英国新泽西州。《医学杂志》,337725-733(1997)
[26] Hennig,C.,聚类线性回归模型的可识别性,J.分类,17,2,273-296(2000)·Zbl 1017.62058号
[27] Ho,H.J。;Lin,T.I.,使用斜(T)分布的稳健线性混合模型及其在精神分裂症数据中的应用,Biom。J.,52,4,449-469(2010)·Zbl 1197.62055号
[28] 霍尔兹曼,H。;Munk,A。;Gneiting,T.,椭圆分布有限混合的可识别性,Scand。《统计杂志》,33753-763(2006)·Zbl 1164.62354号
[29] 休伯特,L。;Arabie,P.,比较分区,J.分类,2193-218(1985)
[30] Ingrassia,S.公司。;南卡罗来纳州米诺蒂。;Punzo,A.,通过线性聚类加权模型进行基于模型的聚类,Comput。统计师。数据分析。,71, 159-182 (2014) ·Zbl 1471.62095号
[31] Ingrassia,S.公司。;南卡罗来纳州米诺蒂。;Vittadini,G.,通过椭圆分布的聚类加权方法进行局部统计建模,J.分类,29,3,363-401(2012)·Zbl 1360.62335号
[32] Ingrassia,S.公司。;Punzo,A.,回归混合的决策边界,J.Korean Statist。Soc.,45,2,295-306(2016)·Zbl 1341.62181号
[33] Ingrassia,S.公司。;Punzo,A.,通过总平方和分解对回归混合物进行聚类验证,J.分类(2019年)
[34] Ingrassia,S.公司。;Punzo,A。;维塔迪尼,G。;Minotti,S.C.,广义线性混合聚类加权模型,J.Classification,32,1,85-113(2015)·Zbl 1331.62310号
[35] Jansen,R.C.,使用EM算法的广义线性有限混合模型中的最大似然,生物统计学,49,227-231(1993)
[36] Keribin,C.,混合物模型阶数的一致估计,SankhyōA,62,49-66(2000)·兹比尔1081.62516
[37] 康拉德,S。;斯金纳,S。;Kazadi,G.B。;Gartner,K。;Lim,H.J.,加拿大萨斯卡通的HIV疾病进展到CD4计数(<200)细胞(/\mu)L和死亡。J.感染。数字化信息系统。医学微生物学。,24, 97-101 (2013)
[38] 科茨,S。;Nadarajah,S.,《多元(T)分布及其应用》(2004),剑桥大学出版社:剑桥大学出版社·Zbl 1100.62059号
[39] Krentz,H.B。;奥尔德,M.C。;Gill,M.J.,艾滋病毒感染晚期(CD\(4<200\)细胞/\(operatorname{mu})L)患者的高医疗费用,HIV Med.,5,93-98(2004)
[40] 新墨西哥州莱尔德。;Ware,J.H.,纵向数据的随机效应模型,生物统计学,38,963-974(1982)·Zbl 0512.62107号
[41] 拉蒙特,A.E。;弗蒙特,J.K。;Van Horn,M.L.,回归混合模型:建模自变量和潜在类之间的协方差是否会改善结果?,多变量。Behav Res.,51,1,35-52(2016)
[42] Lederman,M.M。;康尼克,E。;A.兰迪。;Kuritzkes博士。;Spritzler,J。;Clair,M.S。;Kotzin,B.L。;福克斯,L。;Chiozzi,M.H。;Leonard,J.M。;卢梭,F。;韦德,M。;Roe,J.D。;马丁内斯。;Harold,K.,《与齐多夫定、拉米夫定和利托那韦组成的联合抗逆转录病毒治疗12周相关的免疫应答:艾滋病临床试验组315方案的结果》,《感染杂志》。数字化信息系统。,178, 70-79 (1998)
[43] Lee,W.L。;Chen,Y.C。;谢家胜,基于M带小波变换的分形特征向量超声肝组织分类,IEEE Trans。医学成像,22382-392(2003)
[44] Liang,H。;Wu,H。;Carroll,R.J.,艾滋病临床研究中病毒学和免疫反应之间的关系,使用具有测量误差的混合效应变系数模型,生物统计学,4297-312(2003)·Zbl 1141.62350号
[45] Lin,T.I。;Lee,J.C.,《应用于多发性硬化症数据的线性混合模型的稳健方法》,《统计医学》,第25期,第1397-1412页(2006年)
[46] Lin,T.I。;Lee,J.C.,使用多元分布进行分层线性混合建模的贝叶斯分析,J.Statist。计划。推断,137484-495(2007)·Zbl 1102.62026号
[47] Lin,T.I。;Lee,J.C.,《纵向数据具有偏正态随机效应的线性混合模型中的估计和预测》,《统计医学》,第27期,1490-1507页(2008年)
[48] Lin,T.I。;Wang,W.L.,多结果纵向数据的多元偏正态线性混合模型,统计模型。,13, 199-221 (2013) ·Zbl 07257455号
[49] Lin,T.I。;Wang,W.L.,多变量-(t)非线性混合模型及其在审查多结果艾滋病研究中的应用,生物统计学,18666-681(2017)
[50] Lindstrom,M.J。;Bates,D.M.,重复测量数据线性混合效应模型的Newton-Raphson和EM算法,J.Amer。统计师。协会,83,404,1014-1022(1988)·Zbl 0671.65119号
[51] Lo,K。;Gottardo,R.,《通过带Box-Cox变换的多元(t)分布进行灵活混合建模:斜(t)分配的替代方法》,Stat.Compute。,22,1,33-52(2012年)·Zbl 1322.62173号
[52] Louis,T.A.,《使用EM算法时发现观测信息矩阵》,J.R.Stat.Soc.Ser。B统计方法。,44, 226-233 (1982) ·Zbl 0488.62018号
[53] Maruotti,A。;Punzo,A.,具有协变量和离群值的多元纵向数据的基于模型的时变聚类,计算。统计师。数据分析。,113, 475-496 (2017) ·Zbl 1464.62128号
[54] McLachlan,G.J。;Peel,D.,有限混合模型(2000),John Wiley&Sons:John Willey&Sons纽约·Zbl 0963.62061号
[55] 孟晓乐。;van Dyk,D.,《EM算法》,J.R.Stat.Soc.Ser,一首古老的民歌,随着一个快速的新曲调演唱。B统计方法。,59, 511-567 (1997) ·兹比尔1090.62518
[56] Ng,S.K。;McLachlan,G.J.,聚类多级增长轨迹的混合模型,计算。统计师。数据分析。,71, 43-51 (2014) ·Zbl 1471.62149号
[57] Ng,S.K。;麦克拉克伦,G.J。;王凯。;Jones,L.B.T。;Ng,S.W.,聚类相关基因表达谱的随机效应成分混合模型,生物信息学,221745-1752(2006)
[58] Pfeifer,C.,基于混合效应半参数回归的纵向剖面分类,《统计医学》,第4期,第314-323页(2004年)·Zbl 1061.62200号
[59] 皮涅罗,J.C。;贝茨,D.M。;DebRoy,S。;Sarkar,D。;团队R.Development Coro,nlme:线性和非线性混合效应模型(2019),R包版本3.1-141
[60] 皮涅罗,J.C。;Liu,C.H。;Wu,Y.N.,使用多元(t)分布的线性混合效应模型中稳健估计的有效算法,J.Compute。图表。统计人员。,10, 249-276 (2001)
[61] Punzo,A.,反高斯分布的新视角及其在保险和经济数据中的应用,J.Appl。统计,46,7,1260-1287(2019)·Zbl 1516.62554号
[62] Punzo,A。;Ingrassia,S.,《关于使用广义线性指数聚类加权模型评估二元数据中的局部线性独立性》,QdS J.Methodol。申请。《统计》,第15卷,第131-144页(2013年)
[63] Punzo,A。;Ingrassia,S.,通过聚类加权模型对双变量混合类型数据进行聚类,计算。统计人员。,31, 3, 989-1013 (2016) ·Zbl 1347.65030号
[64] Punzo,A。;Maruotti,A.,聚类多元纵向观测:污染高斯隐马尔可夫模型,J.Compute。图表。统计人员。,25, 4, 1097-1116 (2016)
[65] Punzo,A。;Mazza,A。;McNicholas,P.D.,《污染混合物:用于拟合多变量污染正态分布的简约混合物的R包》,J.Stat.Soft,85,10,1-25(2018)
[66] Punzo,A。;McNicholas,P.D.,多元污染正态分布的节俭混合物,生物。J.,58,6,1506-1537(2016)·Zbl 1353.62124号
[67] Punzo,A。;McNicholas,P.D.,通过污染高斯聚类加权模型进行回归分析中的稳健聚类,J.Classification,34,2,249-293(2017)·Zbl 1373.62316号
[68] R Core Team,A.,R:统计计算的语言和环境(2019),R统计计算基金会:R统计计算基础,奥地利维也纳,URLhttp://www.r-project.org/
[69] Redner,R.A。;Walker,H.F.,《混合密度、最大似然和EM算法》,SIAM Rev.,26195-239(1984)·Zbl 0536.62021号
[70] Ritter,G.,稳健聚类分析和变量选择,(Chapman&Hall/CRC统计学与应用概率专著,第137卷(2015),CRC出版社)·Zbl 1341.62037号
[71] Sahu,S.K。;戴·D·K。;Branco,M.D.,一类新的多元偏斜分布及其在贝叶斯回归模型中的应用,加拿大。J.统计。,31, 129-150 (2003) ·Zbl 1039.62047号
[72] Schwarz,G.,估算模型的维数,Ann.Statist。,6, 461-464 (1978) ·Zbl 0379.62005年
[73] Song,W。;姚,W。;Xing,Y.,拉普拉斯分布稳健混合回归模型拟合,计算。统计师。数据分析。,71, 128-137 (2014) ·兹比尔1471.62189
[74] 宋,P.X.K。;张,P。;Qu,A.,使用多元(t)分布的稳健线性混合效应模型中的最大似然推断,Statist。Sinica,17929-943(2007)·Zbl 1133.62013年
[75] Subedi,S。;Punzo,A。;英格拉西亚,S。;McNicholas,P.D.,基于稳健模型的聚类和降维的聚类加权因子分析,统计方法应用。,24, 4, 623-649 (2015) ·Zbl 1416.62362号
[76] Tan,S.L。;Nott,D.J.,线性混合模型混合物的变分近似,J.计算。图表。统计人员。,23, 564-585 (2014)
[77] Teicher,H.,有限混合的可识别性,《数学年鉴》。Stat.,第34页,第1265-1269页(1963年)·Zbl 0137.12704号
[78] 汤普森,T.J。;史密斯,P.J。;Boyle,J.P.,《具有伴随信息的有限混合模型:糖尿病诊断标准的评估》,J.R.Stat.Soc.Ser。C.申请。Stat.,47,393-404(1998)·Zbl 0905.62112号
[79] Titterington,D.M。;A.F.M.史密斯。;Makov,U.E.,《有限混合分布的统计分析》(1985),Wiley:Wiley纽约·兹伯利0646.62013
[80] Trabzuni,D。;英国大脑表达协会(UKBEC),A.F.M。;汤姆森,P.C.,《使用线性混合模型/有限混合模型方法分析基因表达数据:应用于人脑的区域差异》,生物信息学,第30期,第1555-1561页(2014年)
[81] 韦贝克,G。;Lesaffre,E.,随机效应群体中具有异质性的线性混合效应模型,J.Amer。统计师。协会,91,217-221(1996)·Zbl 0870.62057号
[82] Wang,W.L.,具有异质性和缺失值的多重纵向数据的多元(t)非线性混合模型的混合,Test,28,1,196-222(2019)·Zbl 1420.62290号
[83] Wang,W.L。;Lin,T.I.,混合因子分析仪中最大似然估计的有效ECM算法,计算。统计人员。,28, 2, 751-769 (2013) ·Zbl 1305.65082号
[84] 雅科维茨,S.J。;Spragins,J.,《关于有限混合物的可识别性》,《数学年鉴》。Stat.,39,209-214(1968)·Zbl 0155.25703号
[85] 姚,W。;魏毅。;Yu,C.,使用(t)分布的稳健混合回归,计算。统计师。数据分析。,71, 116-127 (2014) ·兹比尔1471.62227
[86] Yau,K.K.W。;Lee,A.H。;Ng,S.K.,具有随机效应的有限混合回归模型:在新生儿住院时间中的应用,计算。统计师。数据分析。,41, 359-366 (2002) ·Zbl 1256.62065号
[87] 张杰。;Liang,F.,使用指数幂混合的稳健聚类,生物计量,66,4,1078-1086(2010)·Zbl 1233.62192号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。