×

有限混合模型中的经验可识别性。 (英语) Zbl 1440.62246号

摘要:虽然有限混合模型中的参数是不可识别的,但有一种局部可识别的形式,保证了可识别参数区域的存在。为了验证它的存在,从业者使用了关于估计参数的Fisher信息。然而,存在基于Fisher信息的局部可识别性与基于可能性的局部可辨识性不一致的模型/数据情况。在本文中,我们提出了一种对估计参数的局部可识别度进行经验度量的方法,经验可识别性,基于个人构建可识别似然集的能力。通过对似然区域的详细拓扑研究,我们表明,对于任何给定的数据集和混合模型,通常存在有限的置信水平范围,其中似然区域具有可识别子集的自然划分。在置信水平过高的情况下,没有自然的方法可以利用可能性来解决可识别性问题。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62E20型 统计学中的渐近分布理论
62R40型 拓扑数据分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Agresti,A.(2002年)。分类数据分析(第二版)。纽约:Wiley·Zbl 1018.6202号
[2] Böhning,D.,Schlattmann,P.,Lindsay,B.G.(1992)。混合物的计算机辅助分析:统计算法。生物统计学,48283-303。
[3] Böhning,D.,Dietz,E.,Schaub,R.,Schlattmann,P.,Lindsay,B.G.(1994)。单参数指数族密度混合物的似然比分布。统计数学研究所年鉴,46,373-388·Zbl 0802.62017年
[4] 坎贝尔,N.A.,马洪,R.J.(1974)。纤毛蟹属两种岩蟹变异的多元研究。澳大利亚动物学杂志,22417-425。
[5] Chen,H.,Chen,J.(2001)。有限混合模型中均匀性的似然比检验。加拿大统计杂志,29201-215·Zbl 0979.62007
[6] Cox,D.R.,Hinkley,D.V.(2002年)。理论统计。伦敦:查普曼和霍尔·Zbl 0334.62003号
[7] Crawford,S.L.(1994)。拉普拉斯方法在有限混合分布中的应用。《美国统计协会杂志》,89259-267·Zbl 0795.62022号
[8] Davison,A.C.,Hinkley,D.V.(1997年)。引导方法及其应用。剑桥:剑桥大学出版社·Zbl 0886.62001号
[9] Dempster,A.P.,Laird,N.M.,Rubin,D.B.(1977年)。通过em算法从不完整数据中获得最大似然。英国皇家统计学会期刊B辑(方法学),39,1-38·Zbl 0364.62022号
[10] Dudley,C.R.K.,Giuffra,L.A.,Raine,A.E.G.,Reeders,S.T.(1991)。评估apnh(一种编码人类阿米洛利敏感的na+/h+反转运蛋白的基因)在红细胞na+/li+反转运个体间变异中的作用。美国肾脏病学会杂志,2937-943。
[11] Efron,B.、Tibshirani,R.J.(1993)。引导程序简介。纽约:查普曼和霍尔出版社·Zbl 0835.62038号
[12] Finch,S.J.、Mendell,N.R.、Thode,H.C.(1989)。全局最大值数值搜索充分性的概率度量。美国统计协会杂志,841020-1023。
[13] Goodman,L.(1974)。使用可识别和不可识别模型进行探索性潜在结构分析。《生物特征》,第61期,第215-231页·Zbl 0281.62057号
[14] Huang,G.H.,Bandeen-Roche,K.(2004)。建立一个可识别的潜在类别模型,该模型对潜在变量和测量变量具有协变量效应。《心理测量学》,69,5-32·Zbl 1306.62433号
[15] Kalbfleisch,J.D.,Prentice,R.L.(1980)。失效时间数据的统计分析。新泽西州:威利·Zbl 0504.62096号
[16] Kim,D.、Lindsay,B.G.(2011年a)。有限混合模型中的模态模拟和可视化。加拿大统计杂志,39,421-437·Zbl 1284.62077号
[17] Kim,D.、Lindsay,B.G.(2011年B)。使用置信分布抽样可视化置信集。中国统计局,21923-948·Zbl 1213.62052号
[18] Kim,D.K.,Taylor,J.M.G.(1995年)。参数线性约束下最大似然估计的限制em算法。美国统计协会杂志,430708-716·Zbl 0826.62019号
[19] Lindsay,B.G.(1995年)。混合模型:理论、几何和应用。在NSF-CBMS概率与统计区域会议系列(第5卷)中。海沃德:数理统计研究所·Zbl 1163.62326号
[20] Liu,X.,Shao,Y.(2003)。可识别性损失下似然比检验的渐近性。统计年鉴,31807-832·兹比尔1032.62014
[21] Matsumoto,Y.(2002年)。莫尔斯理论导论。数学专著的翻译(第208卷)。普罗维登斯:美国数学学会·兹比尔0990.57001
[22] McLachlan,J.,Peel,D.(2000)。有限混合模型。纽约:Wiley·Zbl 0963.62061号
[23] Meeker,W.,Escobar,L.(1995)。基于最大似然估计的近似置信区域教学。《美国统计学家》,49,48-53。
[24] Redner,R.A.,Walker,H.C.(1984年)。混合密度、最大似然和em算法。SIAM评论,26195-239·Zbl 0536.62021号
[25] Roeder,K.(1994)。用于确定混合法线中组件数量的图形技术。美国统计协会杂志,89487-495·Zbl 0798.62004号
[26] Rothenberg,T.(1971)。参数模型中的标识。《计量经济学》,39,577-591·Zbl 0231.62081号
[27] Schelp,F.P.、Vivatanasept,P.、Sitaputra,P.,Sormani,S.、Pongpaew,P..、Vudhivai,N.等人(1990年)。儿童发病率与人体测量和社区卫生干预的关系。热带医学和寄生虫学,41,121-126。
[28] Schlattmann,P.(2005)。关于自举泊松分布有限混合中的分量数。《统计与计算》,第15期,第179-188页。
[29] Teicher,H.(1960年)。关于混合分布。《数理统计年鉴》,31,55-73·Zbl 0107.13501号
[30] Teicher,H.(1963年)。有限混合的可识别性。《数理统计年鉴》,341265-1269·Zbl 0137.12704号
[31] Titterington,D.M.、Smith,A.F.M.、Markov,U.E.(1985)。有限混合模型的统计分析。纽约:Wiley·兹伯利0646.62013
[32] Yakowitz,S.J.,Spragins,J.D.(1968年)。关于有限混合的可识别性。《数理统计年鉴》,39209-214·Zbl 0155.25703号
[33] Yao,W.,Lindsay,B.G.(2009年)。用最高后验密度进行贝叶斯混合标记。美国统计协会杂志,104758-767·Zbl 1388.62007号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。