×

具有条件独立多元成分密度的非参数混合模型。 (英语) Zbl 1466.62040号

摘要:最近提出了有限多元混合物的非参数估计模型和算法,其中通常假设坐标独立于每个观测值所来自的子总体。因此,在这些模型中,依赖结构仅来自混合物。这个假设是宽松的,考虑到独立的多元阻碍坐标,取决于每个观测值所来自的子总体。否则,这些块的密度函数是完全多元和非参数的。提出了该模型的一种类EM算法,并导出了该模型非参数估计步骤中带宽矩阵的选择策略。通过几个数值模拟对该算法的性能进行了评估。在这个新模型和算法上对一个相当大的实际数据集进行了实验,以从基于模型的无监督聚类的角度说明其潜力。

MSC公司:

62-08 统计问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部 哈尔

参考文献:

[1] 奥尔曼,E.S。;马蒂亚斯,C。;Rhodes,J.A.,具有多个观测变量的潜在结构模型中参数的可识别性,Ann.Statist。,37、6A、3099-3132(2009)·兹比尔1191.62003
[2] Benaglia,T。;乔沃,D。;Hunter,D.R.,《多元混合物中半非参数估计的类EM算法》,J.Compute。图表。统计人员。,18, 2, 505-526, (2009)
[3] Benaglia,T。;乔沃,D。;Hunter,D.R.,非参数多元混合的类EM算法中的带宽选择,(非参数统计和混合模型:Thomas P.Hettmansperger(2011),世界科学出版社),15-27·Zbl 1414.62119号
[4] Benaglia,T。;乔沃,D。;亨特·D·R。;Young,D.,Mixtools:分析有限混合模型的R包,J.Stat.Softw。,32, 6, 1-29, (2009)
[5] Bordes,L。;乔沃,D。;Vandekerkhove,P.,半参数混合模型的随机EM算法,计算。统计师。数据分析。,51, 11, 5429-5443, (2007) ·Zbl 1445.62056号
[6] Bordes,L。;莫特莱特,S。;Vandekerkhove,P.,双组分混合模型的半参数估计,Ann.Statist。,34, 3, 1204-1232, (2006) ·Zbl 1112.62029号
[7] Celeux,G。;乔沃,D。;Diebolt,J.,《EM算法的随机版本:混合情况下的实验研究》,J.Stat.Compute。模拟。,55, 287-314, (1996) ·Zbl 0907.62024号
[8] 乔沃,D。;亨特·D·R。;Levine,M.,条件独立多元有限混合模型的半参数估计,Stat.Surv。,9, 1-31, (2015) ·Zbl 1307.62090号
[9] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,《通过EM算法从不完整数据中获得最大似然》,J.R.Stat.Soc.Ser。B统计方法。,39, 1, 1-38, (1977) ·Zbl 0364.62022号
[10] Haario,H。;Saksman,E。;Tamminen,J.,自适应大都市算法,Bernouilli,7,223-242,(2001)·Zbl 0989.65004号
[11] 霍尔,P。;A.内曼。;Pakyari,R。;Elmore,R.T.,多元混合物中的非参数推断,生物统计学,92,3,667-678,(2005)·Zbl 1152.62327号
[12] 霍尔,P。;周晓华,多元混合物成分分布的非参数估计,统计年鉴。,31, 201-224, (2003) ·Zbl 1018.62021号
[13] Hennig,C.,合并高斯混合成分的方法,高级数据分析。分类。,4, 1, 3-34, (2010) ·Zbl 1306.62141号
[14] 亨特,L。;Jorgensen,M.,缺失信息混合数据的混合模型聚类,计算。统计师。数据分析。,41, 3, 429-440, (2003) ·Zbl 1256.62037号
[15] 亨特·D·R。;王,S。;Hettmansperger,T.P.,对称分布混合物的推断,《统计年鉴》。,35, 1, 224-251, (2007) ·Zbl 1114.62035号
[16] Hyndman,R.L.,Zhang,X.,King,M.L.,2004年。使用MCMC进行多元核密度估计的带宽选择。计量经济学会2004澳大利亚会议120,计量经济学会。
[17] Kruskal,J.B.,《更多因素而非受试者、测试和治疗:典型分解和个体差异标度的不确定性定理》,《心理测量学》,41,3,281-293,(1976)·Zbl 0339.92015号
[18] Kruskal,J.B.,《三向数组:三线性分解的秩和唯一性及其在算术复杂性和统计学中的应用》,《线性代数应用》。,18, 2, 95-138, (1977) ·Zbl 0364.15021号
[19] Lee,S.X。;McLachlan,G.J.,关于偏斜正态分布和偏斜分布的混合,高级数据分析。分类。,7, 3, 241-266, (2013) ·Zbl 1273.62115号
[20] 莱文,M。;亨特·D·R。;Chauveau,D.,多元混合物的最大平滑似然,Biometrika,98,2,403-416,(2011)·Zbl 1215.62055号
[21] Lindsay,B.G.,《混合模型:理论、几何和应用》(1995),Ims·Zbl 1163.62326号
[22] McLachlan,G.J。;Krishnan,T.,(《EM算法与扩展》,《概率与统计威利系列:应用概率与统计》,(2008),威利国际科学,纽约)
[23] 麦克拉克伦,G。;Peel,D.,(有限混合模型,《概率与统计中的Wiley级数:应用概率与统计》,(2000),Wiley-Interscience,纽约)·兹比尔0963.62061
[24] R: 《统计计算的语言和环境》(2010年),奥地利维也纳R统计计算基金会
[25] Sawant,K.B.,《使用邻域距离在K-mean算法中高效确定聚类》,国际期刊《急诊工程研究技术》。,3, 22-27, (2015)
[26] Scott,D.W.,(《多元密度估计、理论、实践和可视化》,Wiley Series in Probability and Mathematical Statistics:Applied Probability and Statistics,(1992),John Wiley&Sons Inc.,Wiley-Interscience Publication New York)·Zbl 0850.62006号
[27] Silverman,B.W.,(统计学和数据分析的密度估计,统计学和应用概率专著,(1986),Chapman&Hall London)·Zbl 0617.62042号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。