×

处理真实多模态下混合模型中的标签切换。 (英语) Zbl 1157.62040号

摘要:有限混合模型的拟合是一个不确定的估计问题,因为完全不同的参数化可能导致相似的混合分布。这导致似然中存在多个模式,这是频率最大似然估计的一个问题,并使蒙特卡罗在贝叶斯估计中的马尔可夫链统计推断复杂化。为了分析这些绘图的后验密度,需要将其适当分离为不同的模式。此外,为了解决标签切换问题,有必要对特定成分的估计值进行独特的标记。本文提出并比较了实现这些目标的两种方法:多模态重标记和约束聚类。讨论了算法细节,并在人工数据和真实数据上演示了它们的应用。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
2015年1月62日 贝叶斯推断
65C60个 统计中的计算问题(MSC2010)
85A35型 统计天文学
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,通过EM算法从不完整数据中获取最大似然,皇家统计学会期刊B,39,1-38(1977)·Zbl 0364.62022号
[2] 迪博尔特,J。;Robert,C.P.,通过贝叶斯抽样估计有限混合分布,皇家统计学会杂志B,56363-375(1994)·Zbl 0796.62028号
[3] Redner,R.A。;Walker,H.F.,《混合密度、最大似然和EM算法》,SIAM Review,26,2,195-239(1984)·Zbl 0536.62021号
[4] 马林,J.-M。;Mengersen,K。;Robert,C.P.,混合分布的贝叶斯建模和推断,(Dey,D.;Rao,C.,贝叶斯思维、建模和计算。贝叶斯思考、建模和运算,统计手册,第25卷(2005),北荷兰人:北荷兰阿姆斯特丹),459-507,(第16章)·Zbl 1136.62012年
[5] Jasra,A。;C.C.福尔摩斯。;Stephens,D.A.,马尔可夫链蒙特卡罗方法和贝叶斯混合建模中的标签切换问题,统计科学,20,1,50-67(2005)·Zbl 1100.62032号
[6] Frühwirth-Schnatter,S.,(有限混合和马尔可夫切换模型。有限混合和Markov切换模型,统计学中的Springer系列(2006),Springer:Springer New York)·Zbl 1108.6202号
[7] 理查森,S。;Green,P.J.,《关于成分数量未知的混合物的贝叶斯分析》,《皇家统计学会杂志》B,59,4,731-792(1997)·Zbl 0891.62020号
[8] Chung,H。;Loken,E。;Schafer,J.L.,《用有限混合模型进行推断的困难:一个简单的例子和简单的解决方案》,《美国统计学家》,58,2,152-158(2004)
[9] Celeux,G.,混合物的贝叶斯推断:标签转换问题,(Payne,R.;Green,P.,Compstat 1998-计算统计学论文集(1998),Physica Verlag:Physica-Verlag Heidelberg),227-232·Zbl 0951.62018号
[10] M.Stephens,正态分布混合的贝叶斯方法,牛津大学博士论文,1997年;M.Stephens,正态分布混合的贝叶斯方法,牛津大学博士论文,1997年
[11] Stephens,M.,《处理混合模型中的标签切换》,《皇家统计学会杂志》B,62,4,795-809(2000)·兹比尔0957.62020
[12] Hennig,C.,聚类线性回归模型的可识别性,分类杂志,17,2,273-296(2000)·Zbl 1017.62058号
[13] K.Wagstaff,C.Cardie,S.Rogers,S.Schroedl,带背景知识的约束K-means聚类,载《第十八届机器学习国际会议论文集》,2001年,第577-584页;K.Wagstaff,C.Cardie,S.Rogers,S.Schroedl,带背景知识的约束K-means聚类,载《第十八届机器学习国际会议论文集》,2001年,第577-584页
[14] Leisch,F。;Grün,B.,《扩展标准聚类算法以允许组约束》,(Rizzi,A.;Vichi,M.,Compstat 2006-计算统计中的过程(2006),《物理验证:物理验证:德国海德堡》),885-892
[15] Minnotte,M.C.,模式存在性的非参数测试,《统计年鉴》,第25、4、1646-1660页(1997年)·Zbl 0936.62056号
[16] 考夫曼,L。;Rousseeuw,P.J.,《在数据中寻找群体》(1990),John Wiley&Sons,Inc.:John Willey&Sons公司,美国纽约·Zbl 1345.62009号
[17] Papadimitriou,C。;Steiglitz,K.,《组合优化:算法和复杂性》(1982),普伦蒂斯·霍尔:普伦蒂斯霍尔-恩格尔伍德悬崖出版社,美国·Zbl 0503.90060号
[18] Hardy,A.,《集群数量》,计算统计与数据分析,23,1,83-96(1996)·Zbl 0900.92186号
[19] Tibshirani,R。;沃尔瑟,G。;Hastie,T.,《通过缺口统计估算数据集中的簇数》,《皇家统计学会期刊B》,63,2,411-423(2001)·Zbl 0979.62046号
[20] 布鲁斯科,M.J。;Cradit,J.D.,《k均值聚类的可变选择启发式》,《心理测量学》,66,2,249-270(2001)·Zbl 1293.62237号
[21] 弗里德曼,J.H。;Meulman,J.J.,《属性子集上的聚类对象》,《皇家统计学会期刊B》,66,4,815-849(2004)·Zbl 1060.62064号
[22] Leisch,F.,《(k)质心聚类分析工具箱》,计算统计与数据分析,51,2,526-544(2006)·Zbl 1157.62439号
[23] 库尔贝克,S。;Leibler,R.A.,《信息与充分性》,《数理统计年鉴》,22,1,79-86(1951)·Zbl 0042.38403号
[24] R开发核心团队,R:统计计算的语言和环境,R统计计算基金会,奥地利维也纳,2008年。网址:http://www.R-project.orgR发展核心团队,R:统计计算的语言和环境,R统计计算基金会,奥地利维也纳,2008年。网址:http://www.R-project.org
[25] M.Plummer,JAGS:使用吉布斯采样分析贝叶斯图形模型的程序,见:K.Hornik,F.Leisch,A.Zeileis(编辑),第三届分布式统计计算国际研讨会论文集,DSC 2003,维也纳理工大学,2003,ISSN 1609-395X。http://www.ci.tuwien.ac.at/Conferences/DSC.htmlM.Plummer,JAGS:使用吉布斯采样分析贝叶斯图形模型的程序,见:K.Hornik,F.Leisch,A.Zeileis(编辑),第三届分布式统计计算国际研讨会论文集,DSC 2003,维也纳理工大学,2003,ISSN 1609-395X。网址:http://www.ci.tuwien.ac.at/Conferences/DSC.html
[26] 休伯特,L。;Arabie,P.,比较分区,分类杂志,2,1,193-218(1985)
[27] Teicher,H.,有限混合物的可识别性,《数理统计年鉴》,34,4,1265-1269(1963)·Zbl 0137.12704号
[28] Grün,B。;Leisch,F.,Bootstrapping有限混合模型,(Antoch,J.,Compstat 2004-计算统计论文集(2004),Physica Verlag:Physica-Verlag Heidelberg),1115-1122
[29] Grün,B。;Leisch,F.,《有限混合模型中真实多模态的测试:线性回归模型的应用》(Decker,R。;Lenz,H.-J.,《数据分析进展》,《Gesellschaft für Klassifikation第30届年会论文集》。《数据分析进展》,《Gesellschaft für Klassifikation第30届年会论文集》,《分类、数据分析和知识组织研究》,第33卷(2007),Springer-Verlag),209-216
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。