×

使用MM算法选择变量。 (英语) Zbl 1078.62028号

摘要:变量选择是高维统计建模的基础。许多变量选择技术可以通过使用各种惩罚函数的最大惩罚似然来实现。优化受惩罚的似然函数通常具有挑战性,因为它可能是不可微和/或不可压缩的。本文提出了一类新的算法,用于寻找一类惩罚函数的惩罚似然最大化。这些算法的操作方法是稍微扰动罚函数使其可微,然后使用minorize优化该可微函数-最大化(MM)算法。
MM算法是众所周知的EM算法类的有用扩展,这一事实使我们能够使用EM算法所采用的一些技术分析所提算法的局部和全局收敛性。特别地,我们证明了当MM算法收敛时,它们必须收敛到一个理想点;我们还讨论了保证收敛的条件。我们利用这些算法的Newton-Raphson-like特性,提出了估计量标准误差的三明治估计。我们的方法在数值试验中表现良好。

MSC公司:

62F99型 参数化推理
65立方厘米60 统计中的计算问题(MSC2010)
62J12型 广义线性模型(逻辑模型)
65C20个 概率模型,概率统计中的通用数值方法
10层62层 点估计
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Antoniadis,A.(1997)。统计学中的小波:综述(附讨论)。J.意大利统计学会6 97–144。
[2] Antoniadis,A.和Fan,J.(2001)。小波近似的正则化(讨论)。J.艾默。统计师。协会96 939–967·兹比尔1072.62561 ·doi:10.1198/016214501753208942
[3] Cai,J.,Fan,J.、Li,R.和Zhou,H.(2005)。多元故障时间数据的变量选择。生物特征·Zbl 1094.62123号 ·doi:10.1093/biomet/92.2.303
[4] Cox,D.R.(1975)。部分可能性。生物特征62 269–276·Zbl 0312.62002号 ·doi:10.1093/biomet/62.2.269
[5] Craven,P.和Wahba,G.(1979年)。用样条函数平滑噪声数据:用广义交叉验证方法估计平滑的正确程度。数字。数学。31 377–403. ·Zbl 0377.65007号 ·doi:10.1007/BF01404567
[6] Dempster,A.P.、Laird,N.M.和Rubin,D.B.(1977年)。通过EM算法获得不完整数据的最大似然(讨论后)。J.罗伊。统计师。Soc.序列号。B 39 1–38·Zbl 0364.62022号
[7] Fan,J.和Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。J.艾默。统计师。协会96 1348–1360·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[8] Fan,J.和Li,R.(2002)。考克斯比例风险模型和脆弱性模型的变量选择。安。统计师。30 74–99. ·Zbl 1012.62106号 ·doi:10.1214/aos/1015362185
[9] Fan,J.和Li,R.(2004)。纵向数据分析中半参数建模的新估计和模型选择程序。J.艾默。统计师。协会99 710–723·Zbl 1117.62329号 ·doi:10.1198/016214500000060
[10] Fan,J.和Peng,H.(2004)。具有发散参数数的非凹陷惩罚似然。安。统计师。32 928–961. ·Zbl 1092.62031号 ·doi:10.1214/009053604000000256
[11] Frank,I.E.和Friedman,J.H.(1993年)。一些化学计量学回归工具的统计视图(含讨论)。技术计量35 109–148·Zbl 0775.62288号 ·doi:10.2307/1269656
[12] 海瑟·W·J(1995)。迭代优化收敛计算:多维数据分析中的理论和应用。在《描述性多变量分析的最新进展》(W.J.Krzanowski编辑)157–189中。牛津克拉伦登出版社。
[13] Hestenes,M.R.(1975年)。优化理论:有限维情形。纽约威利·Zbl 0327.90015号
[14] Hunter,D.R.和Lange,K.(2000年)。再次讨论“使用替代目标函数的优化转移”。计算杂志。图表。统计师。9 52–59.
[15] Kauermann,G.和Carroll,R.J.(2001年)。三明治协方差矩阵估计效率的注记。J.艾默。统计师。协会96 1387–1396·Zbl 1073.62539号 ·doi:10.1198/016214501753382309
[16] Lange,K.(1995)。梯度算法局部等价于EM算法。J.罗伊。统计师。Soc.序列号。B 57 425–437·Zbl 0813.62021号
[17] Lange,K.、Hunter,D.R.和Yang,I.(2000年)。使用替代目标函数优化传输(讨论)。J.计算。图表。统计师。9 1–59.
[18] McLachlan,G.和Krishnan,T.(1997)。EM算法和扩展。纽约威利·Zbl 0882.62012号
[19] 孟晓乐(1994)。关于ECM算法的收敛速度。安。统计师。22 326–339。JSTOR公司:·Zbl 0803.65146号 ·doi:10.1214/aos/1176325371
[20] Meng,X.-L.和Van Dyk,D.A.(1997年)。EM算法——一首古老的民歌,以快速的新曲调演唱(带讨论)。J.罗伊。统计师。Soc.序列号。B 59 511-567·Zbl 1090.62518号 ·数字对象标识代码:10.1111/1467-9868.00082
[21] Miller,A.J.(2002)。回归中的子集选择,第二版,查普曼和霍尔,伦敦·Zbl 1051.62060号
[22] Ortega,J.M.(1990)。数值分析:第二课程,第二版,SIAM,费城·Zbl 0701.65002号
[23] Tibshirani,R.(1996)。通过套索回归收缩和选择。J.罗伊。统计师。Soc.序列号。B 58 267–288·Zbl 0850.62538号
[24] Wu,C.-F.J.(1983年)。关于EM算法的收敛性。安。统计师。11 95–103. JSTOR公司:·Zbl 0517.62035号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。