×

方差分量模型的MM算法。 (英语) Zbl 07499058号

摘要:方差分量估计和混合模型分析是统计学的中心主题,在许多科学学科中都有应用。尽管几代统计学家和数值分析师尽了最大努力,但最大似然估计(MLE)和方差分量模型的有限MLE在数值上仍然具有挑战性。基于最小化最大化(MM)原理,提出了一种新的方差分量估计迭代算法。我们的MM算法实现起来很简单,在大数据问题上具有竞争力。该算法很容易扩展到更复杂的问题,例如线性混合模型、可能具有缺失数据的多元响应模型、最大后验估计和惩罚估计。我们建立了MM算法到Karush-Kuhn-Tucker点的全局收敛性,并从数值和理论上证明了当方差分量数大于2且所有协方差矩阵均为正定时,它比经典EM算法收敛得更快。本文的补充材料可在网上获得。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 贝茨,D。;Mächler,M。;Bolker,B。;Walker,S.,“使用lme4拟合线性混合效应模型”,《统计软件杂志》,67,1-48(2015)
[2] 贝茨,D。;Pinheiro,J.,技术报告技术备忘录BL0112140-980226-01TM,“多层模型的计算方法”,(1998),新泽西州默里山:贝尔实验室,朗讯科技,新泽西
[3] 贝茨,D.M。;Watts,D.G.,非线性回归分析及其应用。《概率与数理统计中的威利系列:应用概率与统计学》(1988),纽约:威利,纽约·兹比尔0728.62062
[4] 比恩,J。;Tibshirani,R.J.,“协方差矩阵的稀疏估计”,《生物统计学》,98,807-820(2011)·Zbl 1228.62063号 ·doi:10.1093/biomet/asr054
[5] 博格,I。;Groenen,P.J.,《现代多维尺度:理论与应用》(2005),纽约:Springer科学与商业媒体,纽约·Zbl 1085.62079号
[6] 博伊德,S。;Vandenberghe,L.,凸优化(2004),剑桥:剑桥大学出版社,剑桥·Zbl 1058.90049号
[7] 卡拉南,T.P。;Harville,D.A.,“计算方差分量限制最大似然估计的一些新算法”,《统计计算模拟杂志》,38,239-259(1991)·Zbl 0800.62423号 ·网址:10.1080/00949659108811332
[8] De Leeuw,J。;博克,H.-H。;Lenski,W。;Richter,M.M.,《信息系统和数据分析》,“统计学中的块松弛算法”,308-324(1994),纽约:Springer,纽约
[9] Demidenko,E。;Massam,H.,“关于方差分量模型中最大似然估计的存在性”,Sankhyá,系列A,61,431-443(1999)·Zbl 0972.62034号
[10] Dempster,A。;莱尔德,N。;Rubin,D.,“通过EM算法从不完整数据中获得最大似然”,《皇家统计学会期刊》,B辑,39,1-38(1977)·Zbl 0364.62022号 ·doi:10.1111/j.2517-6161.1977.tb01600.x
[11] 丁,J。;田,G.-L。;Yuen,K.C.,“比例风险模型中约束估计的新MM算法”,计算统计与数据分析,84,135-151(2015)·Zbl 1507.62048号 ·doi:10.1016/j.csda.2014.11.005
[12] 范,J。;Lv,J.,“超高维特征空间的确定独立筛选”(含讨论),《皇家统计学会杂志》,B辑,70849-911(2008)·Zbl 1411.62187号 ·doi:10.1111/j.1467-9868.2008.00674.x
[13] Golub,G.H。;Van Loan,C.F.,《矩阵计算》,《约翰·霍普金斯数学科学研究》(1996),马里兰州巴尔的摩:约翰·霍普金大学出版社,马里兰州·Zbl 0865.65009号
[14] Grzadziel,M。;Michalski,A.,“关于方差分量模型中最大似然估计存在性的注记”,《缺血数学概率与统计学》。,34, 159-167 (2014) ·Zbl 1326.62153号 ·doi:10.7151/dmps.1164
[15] 古普塔,A。;Nagar,D.,《纯粹数学和应用数学中的矩阵变量分布、专著和调查》(1999),佛罗里达州博卡拉顿:查普曼和霍尔/CRC出版社,佛罗里达州波卡拉顿·Zbl 0935.62064号
[16] 哈特利,H.O。;Rao,J.N.K.,“方差模型混合分析的最大似然估计”,Biometrika,54,93-108(1967)·Zbl 0178.2001号 ·doi:10.1093/biomet/54.1-2.93
[17] 哈维尔,D。;卡拉南,T。;Gianola,D。;Hammond,K.,家畜遗传改良统计方法的进展,18,“基于似然的方差成分推断的计算方面,136-176(1990),柏林:斯普林格,柏林
[18] Harville,D.A.,“方差分量估计和相关问题的最大似然方法”,《美国统计杂志》。协会,72,320-340(1977)·Zbl 0373.62040号 ·doi:10.2307/2286796
[19] Heiser,W.J.,“迭代优化的收敛计算:多维数据分析的理论和应用”,描述性多元分析的最新进展,157-189(1995)
[20] 霍恩,R.A。;Johnson,C.R.,矩阵分析(1985),剑桥:剑桥大学出版社,剑桥·Zbl 0576.15001号
[21] 胡贝尔,P.J。;Ronchetti,E.M.,《稳健统计》(2009),新泽西州霍博肯:新泽西州霍博肯市威利·Zbl 1276.62022号
[22] Hunter,D.R.,“广义布莱德雷-特里模型的MM算法”,《统计年鉴》,32,384-406(2004)·Zbl 1105.62359号 ·doi:10.1214/aos/1079120141
[23] 亨特·D·R。;Lange,K.,《用比例奇数模型计算估计值》,统计数学研究所年鉴,54,155-168(2002)·Zbl 0991.62080号 ·doi:10.1023/A:1016126007531
[24] 亨特·D·R。;Lange,K.,“MM算法教程,美国统计学家,58,30-37(2004)
[25] 亨特·D·R。;Li,R.,“使用MM算法进行变量选择”,《统计年鉴》,第33期,第1617-1642页(2005年)·Zbl 1078.62028号 ·doi:10.1214/009053605000000200
[26] Jeon,M.,《测量和增长的复杂广义线性混合模型的估计》(2012年)
[27] Kiers,H.A.,“建立交替最小二乘和迭代优化算法以解决各种矩阵优化问题”,计算统计与数据分析,41,157-170(2002)·Zbl 1018.65074号 ·doi:10.1016/S0167-9473(02)00142-1
[28] 莱尔德,N。;兰格,N。;斯特拉姆,D.,“重复测量的最大似然计算:EM算法的应用”,美国统计协会杂志,82,97-105(1987)·Zbl 0613.62063号 ·doi:10.1080/016214519987.10478395
[29] 新墨西哥州莱尔德。;Ware,J.H.,“纵向数据的随机效应模型”,生物计量学,38963-974(1982)·Zbl 0512.62107号
[30] 新墨西哥州莱尔德。;Ware,J.H.,统计学家数值分析,统计与计算(2010),纽约:Springer,纽约
[31] Lange,K.,MM Optimization Algorithms(2016),宾夕法尼亚州费城:工业和应用数学学会,宾夕法尼亚州,费城·Zbl 1357.90002号
[32] 兰格,K。;亨特·D·R。;Yang,I.,“使用替代目标函数的优化转移”,《计算与图形统计杂志》,9,1-59(2000)
[33] 兰格,K。;Papp,J。;辛希默,J。;Sripracha,R。;周,H。;Sobel,E.,“孟德尔:遗传分析程序的瑞士军刀”,生物信息学,291568-1570(2013)·doi:10.1093/生物信息学/btt187
[34] 兰格,K。;Sinsheimer,J.S.,“正态/独立分布及其在稳健回归中的应用”,《计算与图形统计杂志》,2175-198(1993)·doi:10.1080/10618600.1993.10474606
[35] 兰格,K。;Zhou,H.,“几何和符号规划的MM算法”,《数学规划》,A辑,143,339-356(2014)·Zbl 1286.90110号 ·doi:10.1007/s10107-012-0612-1
[36] Lee,S。;Abecasis,G.R。;Boehnke,M。;Lin,X.,“Rare-variant关联分析:研究设计和统计检验”,《美国人类遗传学杂志》,95,5-23(2014)·doi:10.1016/j.ajhg.2014.06.009
[37] Lindstrom,M.J。;Bates,D.M.,“重复测量数据线性混合效应模型的Newton-Raphson和EM算法”,美国统计协会杂志,83,1014-1022(1988)·Zbl 0671.65119号 ·doi:10.2307/2290128
[38] Lindstrom,M.J。;Bates,D.M.,《重复测量数据的非线性混合效应模型》,生物统计学,46,673-687(1990)
[39] McLachlan,G.J。;Krishnan,T.,《EM算法与扩展》,《概率与统计中的威利级数》(2008),新泽西州霍博肯:威利国际科学,新泽西省霍博肯·Zbl 1165.62019号
[40] 孟,X.-L。;Rubin,D.B.,“使用EM获得渐近方差协方差矩阵:SEM算法”,美国统计协会杂志,86,899-909(1991)·doi:10.1080/01621459.1991.10475130
[41] 皮涅罗,J。;Bates,D.,“方差协方差矩阵的无约束参数化”,统计学与计算,6289-296(1996)·doi:10.1007/BF00140873文件
[42] Rao,C.R.,《线性统计推断及其应用》(1973),纽约:威利出版社,纽约·Zbl 0256.6202号
[43] 里根,E.A。;霍坎森,J.E。;J.R.墨菲。;品牌,B。;Lynch,D.A。;Beaty,T.H。;Curran-Everett,D。;Silverman,E.K。;Crapo,J.D.,“慢性阻塞性肺病(COPD)的遗传流行病学研究设计,慢性阻塞性肺疾病,7,32-43(2010)·doi:10.10109/115412550903499522
[44] Schafer,J.L。;Yucel,R.M.,“具有缺失值的多元线性混合效应模型的计算策略”,《计算与图形统计杂志》,11,437-457(2002)·doi:10.1198/106186002760180608
[45] 谢尔多夫,J。;Bühlmann,P。;van de Geer,S.,“使用(####)-惩罚估计高维线性混合效应模型”,《斯堪的纳维亚统计杂志》,38,197-214(2011)·Zbl 1246.62161号 ·doi:10.1111/j.1467-9469.2011.00740.x
[46] Schur,J.,“Bemerkungen zur Theorye der beschränkten Bilineformen mit unedlich vielen Veränderlichen”,《裘皮与莱茵与安格万特数学杂志》,140,1-28(1911)
[47] 吴,T.T。;Lange,K.,“新兴市场的MM替代品”,《统计科学》,25492-505(2010)·Zbl 1329.62106号 ·doi:10.1214/08-STS264
[48] Yen,T.-J,“使用尖峰和平顶先验的变量选择的最大化-最小化方法”,《统计年鉴》,391748-1775(2011)·Zbl 1220.62065号 ·doi:10.1214/11-AOS884
[49] Yu,Y.,“计算最优设计的一般算法的单调收敛性”,《统计学年鉴》,38,1593-1606(2010)·Zbl 1189.62125号 ·doi:10.1214/09-AOS761
[50] 周,H。;Lange,K.,“一些离散多元分布的MM算法”,《计算与图形统计杂志》,19645-665(2010)·doi:10.1198/jcgs.2010.09014
[51] 周杰杰。;胡,T。;乔·D。;Cho,M.H。;Zhou,H.,“利用单核苷酸多态性集的有效精确方差分量测试提高基因绘图能力和效率”,《遗传学》,204921-931(2016)·doi:10.1534/genetics.116.190454
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。