×

组分数目未知的正态混合物的统计推断。 (英语) Zbl 07603105号

摘要:由于不可辨识性、退化Fisher矩阵和边界参数等问题,对于成分数目未知的正态混合模型的统计推断一直是一个具有挑战性的问题。本文针对分量个数未知的混合法线,提出了一种惩罚似然估计方法,以实现分量参数估计量的阶选择一致性和根收敛速度。我们证明,对于过拟合正态混合模型,所提出的新估计可以避免陷入参数空间不可识别子集的某些退化区域,从而可以导出混合对数似然的正则渐近二次泰勒展开式。在适当的混合比例惩罚函数下,证明了新的估计量在阶数选择上是一致的,并且具有渐近正态分布。我们导出的稀疏性条件还揭示了一些常用惩罚函数之间令人惊讶但有趣的差异,并解释了为什么一些常用的惩罚函数(如Lasso和SCAD)的性能在顺序选择中提供了不令人满意的结果。进行了大量仿真和实际数据分析,以证明新提出的估计器的有效性。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] BUDANOVA,S.(2016)。有限混合模型的惩罚最大似然估计,伊利诺伊州埃文斯顿西北大学博士论文,工作论文。
[2] CHEN,H.、CHEN,J.和KALBFLEISCH,J.D.(2004)。两组分有限混合模型的测试。英国皇家统计学会杂志:B辑(统计方法)66 95-115. ·Zbl 1061.62025号
[3] 陈杰(1995)。有限混合模型的最优收敛速度。安。统计师。23 221-233. ·兹比尔0821.62023 ·doi:10.1214/aos/1176324464
[4] CHEN,J.和KHALILI,A.(2008)。具有非光滑惩罚的有限混合模型中的阶数选择。美国统计协会杂志103 1674-1683. ·Zbl 1286.62057号 ·doi:10.1198/01621450080001075
[5] CHEN,J.和LI,P.(2009)。正态混合模型的假设检验:EM方法。统计年刊37 2523-2542. ·Zbl 1173.62007年
[6] CHEN,J.、TAN,X.和ZHANG,R.(2008)。均值和方差的正态混合推断。中国统计局18 443-465. ·Zbl 1135.62018号
[7] CHEN,X.、PONOMAREVA,M.和TAMER,E.(2014)。一些有限混合模型中的似然推理。计量经济学杂志182 87-99. ·Zbl 1311.62028号
[8] CIUPERCA,G.、RIDOLFI,A.和IDIER,J.(2003年)。正态混合物的惩罚最大似然估计。斯堪的纳维亚统计杂志30 45-59. ·Zbl 1034.62018年 ·doi:10.1111/1467-9469.00317
[9] DACUNHA-CASTELLE,D.和GASSIAT,E.(1999)。使用局部二次曲线参数化测试模型的阶数:总体混合和平稳ARMA过程。统计年鉴27 1178-1209之间·Zbl 0957.62073号
[10] Fan,J.和Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。美国统计协会杂志96 1348-1360. ·Zbl 1073.62547号
[11] FAN,J.和PENG,H.(2004)。具有发散参数数的非凹陷惩罚似然。统计年鉴32(3) 928-961. ·Zbl 1092.62031号
[12] Fan,J.、Xue,L.和Zou,H.(2014)。折凹惩罚估计的强预言最优性。安。统计师。42 819-849之间·Zbl 1305.62252号 ·doi:10.1214/13-AOS1198
[13] FENG,Z.D.和MCCULLOCH,C.E.(1996年)。在有限混合模型中使用bootstrap似然比。英国皇家统计学会杂志。B系列(方法学)58 609-617. ·Zbl 0906.62021号
[14] FRüHWIRTH-SCHNATTER,S.(2006年)。有限混合和马尔可夫切换模型施普林格·Zbl 1108.6202号
[15] GASSIAT,E.(2002)。似然比不等式及其在各种混合物中的应用。《亨利·庞加莱学院年鉴》(B)概率与统计38 897-906. 爱思唯尔·Zbl 1011.62025号
[16] HEINRICH,P.、KAHN,J.等人(2018年)。有限混合估计的强可辨识性和最优极小极大率。统计年鉴46 2844-2870. ·兹比尔1420.62215
[17] HO,N.,NGUYEN,X.等人(2016)。某些弱可识别有限混合参数估计的收敛速度。统计年鉴44 2726-2755. ·Zbl 1359.62076号
[18] HUANG,T.、PENG,H.和ZHANG,K.(2017)。高斯混合模型的模型选择。中国统计局27 147-169·Zbl 1468.62307号
[19] KERIBIN,C.(2000)。混合模型阶数的一致估计。Sankhy?a,a系列62 49-66. ·Zbl 1081.62516号 ·doi:10.2307/25051289
[20] KHALILI,A.和CHEN,J.(2007)。回归模型有限混合中的变量选择。美国统计协会杂志102 1025-1038. ·兹比尔1469.62306
[21] LANGE,K.(1995年)。梯度算法局部等价于EM算法。英国皇家统计学会杂志57 425-437. ·Zbl 0813.62021号
[22] LANGE,K.、HUNTER,D.R.和YANG,I.(2000)。使用替代目标函数优化传输。计算与图形统计杂志9 1-20.
[23] LEEB,H.和PTSCHER,B.M.(2008)。稀疏估计和预言性质,或Hodges估计的返回。计量经济学杂志142 201-211. ·Zbl 1418.62272号
[24] LEHMANN,E.和CASELLA,G.(1998年)。点估计理论施普林格·Zbl 0916.62017号
[25] LINDSAY,B.G.(1995)。混合模型:理论、几何和应用NSF-CBMS概率统计区域会议系列v 5数理统计学院·Zbl 1163.62326号
[26] 刘旭和邵毅(2003)。可识别性损失下似然比检验的渐近性。统计年鉴31 807-832. ·兹比尔1032.62014
[27] 刘旭和邵毅(2004)。二元正态混合模型中似然比检验的渐近性。统计规划与推断杂志123 61-81. ·兹比尔1050.62025
[28] LOISEL,P.、GOFFINET,B.和OCA,M.G.M.D.(1994)。检测F2群体中的一个主要基因。生物计量学50 512-516. ·Zbl 0825.62767号
[29] MANOLE,T.和KHALILI,A.(2021)。通过Group-Sort-Fuse程序估计有限混合模型中的组分数量。统计年鉴49 3043-3069. ·Zbl 1486.62062号
[30] MCLACHLAN,G.J.和PEEL,D.(2000)。有限混合模型.威利,纽约·Zbl 0963.62061号
[31] 雷德纳(1981)。注意不可识别分布的最大似然估计的一致性。统计年鉴9 225-228. ·Zbl 0453.62021号
[32] 沈欣、潘伟和朱毅(2012)。基于似然的选择和尖锐参数估计。美国统计协会杂志107 223-232. PMID:22736876·Zbl 1261.62020年 ·doi:10.1080/01621459.2011.645783
[33] 斯蒂芬斯(2000)。处理混合模型中的标签切换。英国皇家统计协会杂志:B辑62 795-809. ·Zbl 0957.62020号
[34] TIBSHIRANI,R.(1996)。通过套索回归收缩和选择。英国皇家统计学会杂志:B辑58 267-288. ·Zbl 0850.62538号
[35] WICHITHAN,S.、YAO,W.和YANG,G.(2019年)。有限混合模型的假设检验。计算统计与数据分析132 180-189. ·Zbl 1507.62183号
[36] YAO,W.和LINDSAY,B.G.(2009年)。用最高后验密度进行贝叶斯混合标记。美国统计协会杂志104 758-767·Zbl 1388.62007号
[37] Zhang,C.-H.(2010)。极小极大凹惩罚下的几乎无偏变量选择。安。统计师。38 894-942. ·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。