×

在存在多个局部极大值的情况下评估高斯混合模型中的分量数。 (英语) Zbl 1280.62028号

摘要:高斯混合在表示数据的基本结构方面非常灵活。然而,对于协方差矩阵不受限制的高斯混合函数,由于似然函数是无界的,并且通常具有多个局部极大值,因此对其进行似然推断在理论和实践上都具有挑战性。如本文的数值研究所示,包括伪局部极大值在内的多个局部极大值的存在会影响用于选择组件数量的模型选择标准的性能。针对高斯混合模型,我们提出了一种新型的基于似然的估计量,即基于梯度的\(k)-删除最大似然估计量。该估计器的设计目的是避免伪局部最大化,并在存在多个局部最大化的情况下选择统计上理想的局部最大化。我们首先证明了所提估计器的一致性,然后通过实际数据示例和仿真研究,检验了所提方法在基于似然的模型选择准则中的性能,该准则通常用于评估高斯混合模型中的分量数。

MSC公司:

10层62层 点估计
62甲12 多元分析中的估计
2012年12月62日 参数估计量的渐近性质
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[2] 比尔纳茨基,C。;Celeux,G。;Govaert,G.,《用综合完全似然评估聚类的混合模型》,IEEE Trans。模式分析。机器。智力。,22, 719-725 (2000)
[3] 比尔纳基,C。;Chrétien,S.,带em的单变量高斯混合函数最大似然估计中的退化,Statist。普罗巴伯。莱特。,61, 373-382 (2003) ·Zbl 1038.62023号
[4] Böhning,D。;迪茨,E。;Schaub,R。;施拉特曼,P。;Lindsay,B.G.,《单参数指数族密度混合物的似然比分布》,《Ann.Inst.Statist》。数学。,46, 373-388 (1994) ·Zbl 0802.62017年
[5] Bozdogan,H.,《模型选择和akaikes信息标准(aic):一般理论及其分析扩展》,《心理测量学》,52,345-370(1987)·Zbl 0627.62005号
[6] Celeux,G。;Soromenho,G.,评估混合模型中簇数的熵标准,J.分类,13195-212(1996)·Zbl 0861.62051号
[7] 陈,J。;Tan,X.,多元正态混合物的推断,《多元分析杂志》。,100, 1367-1383 (2009) ·Zbl 1162.62052号
[8] 陈,J。;Tan,X。;Zhang,R.,正态混合的惩罚最大似然法在均值和方差中的一致性,统计量。Sinica,18,443-465(2008)·Zbl 1135.62018号
[9] Ciuperca,G.A。;Ridolfi,A。;Idier,J.,正态混合物的惩罚最大似然估计,Scand。J.统计。,30, 45-59 (2003) ·Zbl 1034.62018年
[10] Day,N.E.,估计正态分布混合物的成分,Biometrika,56463-474(1969)·兹比尔0183.48106
[11] Dempster,A。;莱尔德,N。;Rubin,D.,《通过em算法从不完整数据中获得最大似然》,J.R.Stat.Soc.Ser。B、 39、1-38(1977年)·Zbl 0364.62022号
[12] Everitt,B.S。;Hand,D.J.,有限混合分布(1981),查普曼和霍尔:查普曼与霍尔伦敦·Zbl 0466.62018号
[13] 芬奇,S.J。;北卡罗来纳州门德尔。;Thode,H.C.,全球最大值数值搜索充分性的概率度量,J.Amer。统计师。协会,84,1020-1023(1989)
[14] 弗雷利,C。;Raftery,A.E.,有多少簇?哪种聚类方法?答案通过基于模型的聚类分析计算得出。J.,41,578-588(1998)·Zbl 0920.68038号
[15] 弗雷利,C。;Raftery,A.E.,基于模型的聚类、判别分析和密度估计,J.Amer。统计师。协会,97,611-631(2002)·Zbl 1073.62545号
[16] 弗雷利,C。;Raftery,A.E.,正态混合估计和基于模型聚类的贝叶斯正则化,J.分类,24155-181(2007)·Zbl 1159.62302号
[17] Frühwirth-Schnatter,S.,有限混合和马尔可夫转换模型(1996),Springer:Springer纽约·Zbl 1108.6202号
[18] Hathaway,R.J.,正态混合分布最大似然估计的约束公式,《统计年鉴》。,13, 795-800 (1985) ·Zbl 0576.62039号
[19] Hennig,C.,合并高斯混合成分的方法,高级数据分析。分类。,4, 3-34 (2010) ·Zbl 1306.62141号
[20] Keribin,C.,混合模型阶数的一致估计,SankhyáSer。A、 62、49-66(2000)·兹比尔1081.62516
[21] 林德,Y。;Buzo,A。;Gray,R.,矢量量化器设计算法,IEEE Trans。社区。,28, 84-94 (1980)
[22] Lindsay,B.G.,(混合模型:理论、几何学和应用。混合模型:原理、几何学与应用,NSF-CBMS概率统计区域会议系列,第5卷(1995年),IMS:IMS US)·Zbl 1163.62326号
[23] McLachlan,G.J。;Peel,D.,有限混合模型(2000),John Wiley and Sons Ltd.:纽约John Willey and Sons有限公司·Zbl 0963.62061号
[24] Schwarz,G.,估算模型的维数,Ann.Statist。,6, 461-464 (1978) ·Zbl 0379.62005年
[25] 塞德尔,W。;S˘evcíková,H.,混合模型中的极大似然类型及其对测试性能的影响,《Ann.Inst.Statist》。数学。,56, 631-654 (2004) ·Zbl 1078.62014号
[26] Seo,B。;Kim,D.,正态混合模型中的根选择,计算。统计师。数据分析。,56, 2454-2470 (2012) ·Zbl 1252.62013年
[27] Seo,B。;Lindsay,B.G.,双平滑MLE的计算策略,以正常混合模型为例,Compute。统计师。数据分析。,54, 1930-1941 (2010) ·兹比尔1284.62234
[28] 小型,C.G。;Wang,J。;Yang,Z.,消除估算中的多重根源问题,统计学。科学。,15, 313-332 (2000)
[29] Soromenho,G.,有限混合模型中成分数量测试方法的比较,计算。统计人员。,9, 65-78 (1994) ·Zbl 0940.62043号
[30] 田中,K。;Takemura,A.,当尺度参数指数小时,位置尺度分布有限混合的最大似然估计的强相合性,Bernoulli,121003-2017(2006)·Zbl 1117.62025号
[31] Wald,A.,《关于最大似然估计一致性的注释》,Ann.Math。统计人员。,20, 595-601 (1949) ·Zbl 0034.22902号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。