金大英;布鲁斯·林赛(Bruce G.Lindsay)。 有限混合模型中的经验可识别性。 (英语) Zbl 1440.62246号 Ann.Inst.Stat.数学。 67,第4期,745-772(2015)。 摘要:虽然有限混合模型中的参数是不可识别的,但有一种局部可识别的形式,保证了可识别参数区域的存在。为了验证它的存在,从业者使用了关于估计参数的Fisher信息。然而,存在基于Fisher信息的局部可识别性与基于可能性的局部可辨识性不一致的模型/数据情况。在本文中,我们提出了一种对估计参数的局部可识别度进行经验度量的方法,经验可识别性,基于个人构建可识别似然集的能力。通过对似然区域的详细拓扑研究,我们表明,对于任何给定的数据集和混合模型,通常存在有限的置信水平范围,其中似然区域具有可识别子集的自然划分。在置信水平过高的情况下,没有自然的方法可以利用可能性来解决可识别性问题。 引用于三文件 MSC公司: 62H30型 分类和区分;聚类分析(统计方面) 62E20型 统计学中的渐近分布理论 62R40型 拓扑数据分析 关键词:渐近可识别性;有限混合模型;局部可识别性;似然拓扑;不可识别性 软件:引导库;引导程序 PDF格式BibTeX公司 XML格式引用 \textit{D.Kim}和\textit{B.G.Lindsay},Ann.Inst.Stat.Math。67,第4号,745--772(2015;Zbl 1440.62246) 全文: 内政部 参考文献: [1] Agresti,A.(2002年)。分类数据分析(第二版)。纽约:Wiley·Zbl 1018.6202号 [2] Böhning,D.,Schlattmann,P.,Lindsay,B.G.(1992)。混合物的计算机辅助分析:统计算法。生物统计学,48283-303。 [3] Böhning,D.,Dietz,E.,Schaub,R.,Schlattmann,P.,Lindsay,B.G.(1994)。单参数指数族密度混合物的似然比分布。统计数学研究所年鉴,46,373-388·Zbl 0802.62017年 [4] 坎贝尔,N.A.,马洪,R.J.(1974)。纤毛蟹属两种岩蟹变异的多元研究。澳大利亚动物学杂志,22417-425。 [5] Chen,H.,Chen,J.(2001)。有限混合模型中均匀性的似然比检验。加拿大统计杂志,29201-215·Zbl 0979.62007 [6] Cox,D.R.,Hinkley,D.V.(2002年)。理论统计。伦敦:查普曼和霍尔·Zbl 0334.62003号 [7] Crawford,S.L.(1994)。拉普拉斯方法在有限混合分布中的应用。《美国统计协会杂志》,89259-267·Zbl 0795.62022号 [8] Davison,A.C.,Hinkley,D.V.(1997年)。引导方法及其应用。剑桥:剑桥大学出版社·Zbl 0886.62001号 [9] Dempster,A.P.,Laird,N.M.,Rubin,D.B.(1977年)。通过em算法从不完整数据中获得最大似然。英国皇家统计学会期刊B辑(方法学),39,1-38·Zbl 0364.62022号 [10] Dudley,C.R.K.,Giuffra,L.A.,Raine,A.E.G.,Reeders,S.T.(1991)。评估apnh(一种编码人类阿米洛利敏感的na+/h+反转运蛋白的基因)在红细胞na+/li+反转运个体间变异中的作用。美国肾脏病学会杂志,2937-943。 [11] Efron,B.、Tibshirani,R.J.(1993)。引导程序简介。纽约:查普曼和霍尔出版社·Zbl 0835.62038号 [12] Finch,S.J.、Mendell,N.R.、Thode,H.C.(1989)。全局最大值数值搜索充分性的概率度量。美国统计协会杂志,841020-1023。 [13] Goodman,L.(1974)。使用可识别和不可识别模型进行探索性潜在结构分析。《生物特征》,第61期,第215-231页·Zbl 0281.62057号 [14] Huang,G.H.,Bandeen-Roche,K.(2004)。建立一个可识别的潜在类别模型,该模型对潜在变量和测量变量具有协变量效应。《心理测量学》,69,5-32·Zbl 1306.62433号 [15] Kalbfleisch,J.D.,Prentice,R.L.(1980)。失效时间数据的统计分析。新泽西州:威利·Zbl 0504.62096号 [16] Kim,D.、Lindsay,B.G.(2011年a)。有限混合模型中的模态模拟和可视化。加拿大统计杂志,39,421-437·Zbl 1284.62077号 [17] Kim,D.、Lindsay,B.G.(2011年B)。使用置信分布抽样可视化置信集。中国统计局,21923-948·Zbl 1213.62052号 [18] Kim,D.K.,Taylor,J.M.G.(1995年)。参数线性约束下最大似然估计的限制em算法。美国统计协会杂志,430708-716·Zbl 0826.62019号 [19] Lindsay,B.G.(1995年)。混合模型:理论、几何和应用。在NSF-CBMS概率与统计区域会议系列(第5卷)中。海沃德:数理统计研究所·Zbl 1163.62326号 [20] Liu,X.,Shao,Y.(2003)。可识别性损失下似然比检验的渐近性。统计年鉴,31807-832·兹比尔1032.62014 [21] Matsumoto,Y.(2002年)。莫尔斯理论导论。数学专著的翻译(第208卷)。普罗维登斯:美国数学学会·兹比尔0990.57001 [22] McLachlan,J.,Peel,D.(2000)。有限混合模型。纽约:Wiley·Zbl 0963.62061号 [23] Meeker,W.,Escobar,L.(1995)。基于最大似然估计的近似置信区域教学。《美国统计学家》,49,48-53。 [24] Redner,R.A.,Walker,H.C.(1984年)。混合密度、最大似然和em算法。SIAM评论,26195-239·Zbl 0536.62021号 [25] Roeder,K.(1994)。用于确定混合法线中组件数量的图形技术。美国统计协会杂志,89487-495·Zbl 0798.62004号 [26] Rothenberg,T.(1971)。参数模型中的标识。《计量经济学》,39,577-591·Zbl 0231.62081号 [27] Schelp,F.P.、Vivatanasept,P.、Sitaputra,P.,Sormani,S.、Pongpaew,P..、Vudhivai,N.等人(1990年)。儿童发病率与人体测量和社区卫生干预的关系。热带医学和寄生虫学,41,121-126。 [28] Schlattmann,P.(2005)。关于自举泊松分布有限混合中的分量数。《统计与计算》,第15期,第179-188页。 [29] Teicher,H.(1960年)。关于混合分布。《数理统计年鉴》,31,55-73·Zbl 0107.13501号 [30] Teicher,H.(1963年)。有限混合的可识别性。《数理统计年鉴》,341265-1269·Zbl 0137.12704号 [31] Titterington,D.M.、Smith,A.F.M.、Markov,U.E.(1985)。有限混合模型的统计分析。纽约:Wiley·兹伯利0646.62013 [32] Yakowitz,S.J.,Spragins,J.D.(1968年)。关于有限混合的可识别性。《数理统计年鉴》,39209-214·Zbl 0155.25703号 [33] Yao,W.,Lindsay,B.G.(2009年)。用最高后验密度进行贝叶斯混合标记。美国统计协会杂志,104758-767·Zbl 1388.62007号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。