×

有限混合模型的推断和装箱的影响。 (英语) Zbl 1427.62115号

摘要:有限混合模型在生命科学中广泛用于数据分析。然而,这些模型与数据的校准仍然具有挑战性,因为优化问题往往不存在。这适用于审查和未审查数据,是由对称性和其他类型的不可识别性引起的。在这里,我们从理论角度讨论了有限混合模型的参数估计和模型选择问题。我们回顾了现有的文献,并说明了均匀分布和正态分布混合的校正问题的适用性。此外,我们还评估了区间截尾对该估计问题的影响。有趣的是,我们发现,与从未经审查的数据进行推断相比,适当的审查处理可以帮助估计混合成分的数量,这是一个乍看之下令人惊讶的结果。这份手稿的目的是提高人们对有限混合模型校准挑战的认识,并概述可用技术。

MSC公司:

62N01号 截尾数据模型
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Ahmed,A.El.-B.和A.M.Al-Zaydi(2013):“基于广义顺序统计的一类有限混合分布下的推断”,《开放统计杂志》,第3期,第231-244页。
[2] Akaike,H.(1971):“信息理论和最大似然原理的扩展”,摘自:第二届信息理论国际研讨会。编辑:B.N.Petrov和F.Csaki。布达佩斯:Akademiai Kiado:察干吸附、亚美尼亚、苏联。第267-281页·Zbl 0283.62006号
[3] Benaglia,T.、D.Chauveau、D.R.Hunter和D.S.Young(2009):“混合工具:分析有限混合模型的R包”,《统计软件杂志》。,32, 1-29.
[4] Bishop,C.(2006):模式识别和机器学习。信息科学与统计,Springer Verlag New York·Zbl 1107.68072号
[5] Bodenmiller,B.、E.R.Zunder、R.Finck、T.J.Chen、E.S.Savig、R.V.Bruggner、E.F.Simonds、S.C.Bendall、K.Sachs、P.O.Krutzik和G.P.Nolan(2012):“受小分子调控物干扰的细胞状态的多重质量细胞术分析”。《国家生物技术》。,30, 858-867.
[6] Cadez,I.V.,P.Smyth,G.J.Mclachlan和C.E.Mclaren(2002):“装箱和截断多元数据混合密度的最大似然估计”。学习。,47, 7-34. ·Zbl 1012.68057号
[7] Cavanaugh,J.E.(1997):“统一Akaike的推导和修正的AkaikeInformation标准”,《Stat.Probab》。莱特。,201-208年3月31日·Zbl 1130.62302号
[8] Chan,C.,F.Feng,J.Ottinger,D.Foster,M.West和T.B.Kepler。(2008):“流式细胞术中细胞亚型鉴定的统计混合建模。”细胞测量学。A、 73693-701。
[9] Chung,H.、E.Loken和J.L.Schäfer(2004):“用有限混合模型进行推断的困难”,《美国统计》,58,152-158。
[10] Coretto,P.和C.Henning(2011):“高斯分布和均匀分布的异质混合物的最大似然估计。”J.Stat.Plan。推理,141462-473·Zbl 1203.62017年
[11] Craigmile,P.F.和D.M.Tirrerington(1997):“均匀分布有限混合的参数估计”,Commun。统计理论方法,261981-1995·Zbl 0954.62523号
[12] Dennis,J.E.J.(1981):《非线性拟合算法》,收录于:北约高级研究研讨会。英国剑桥:剑桥大学出版社·Zbl 0545.65007号
[13] Efron,B.(1979年):《引导方法:又一次审视折刀》,《美国统计年鉴》第7卷第1-26页·Zbl 0406.62024号
[14] Geissen,E.-M.,J.Hasenauer,S.Heinrich,S.Hauf,F.J.Theis和N.E.Radde(2016):“备忘录:审查数据的多实验混合模型分析”,生物信息学,32,2464-2472。
[15] Hasselblad,V.(1966):“混合正态分布的参数估计”,《技术计量学》,第8431-444页。
[16] Hathaway,R.J.(1985):“正态混合分布最大似然估计的约束公式”,《美国统计年鉴》,第13卷,第795-800页·Zbl 0576.62039号
[17] Holzmann,H.,A.Munk和T.Gneiting(2006):“椭圆分布有限混合的可识别性”,Scand。统计理论应用。,33, 753-763. ·Zbl 1164.62354号
[18] Huang,S.(2009):“发育中细胞的非遗传异质性:不仅仅是噪音”,《发育》(英国剑桥),1363853-3862。
[19] Hussein,A.和J.Liu(2009):“两种均匀分布混合物的参数估计”,《统计计算杂志》。模拟。,79, 395-410. ·Zbl 1169.62011号
[20] Johnsson,K.、J.Wallin和M.Fontes(2016):“贝叶斯流:流式细胞术细胞群的潜在建模”,BMC生物信息学。,17, 1-25.
[21] Kuan,P.、D.Chung、G.Pan、J.A.Thomson、R.Stewart和S.Keles(2011):“芯片组数据分析的统计框架”,《美国统计协会期刊》,第106期,第891-903页·Zbl 1229.62146号
[22] Lee,G.和C.Scott(2012):“截断和删失数据的多元高斯混合模型的EM算法”,《计算》。统计数据分析。,56, 2816-2829. ·Zbl 1255.62308号
[23] Liu,S.,H.Wu和W.Q.Meeker(2015):“理解和解决无限可能性问题”,《美国统计》,69,191-200·Zbl 07671730号
[24] Lo,K.,R.R.Brinkman和R.Gottardo(2008):“通过基于稳健模型的聚类对流式细胞术数据进行自动门控”,《细胞计量学A》,73,321-332。
[25] McLachlan,G.J.(1987):“关于正常混合物成分数量的自举似然比检验统计”,J.R.Stat.Soc.Ser。C申请。《法律总汇》第36318-324页。
[26] McLachlan,G.J.和P.N.Jones(1988):“通过EM算法将混合模型拟合到分组和截断的数据”,《生物计量学》,44,571-578·Zbl 0707.62214号
[27] McLachlan,G.和D.Peel(2005):《有限混合模型》,纽约,奇切斯特,Weinheim,布里斯班,新加坡,多伦多:John Wiley&Sons,Ltd.doi:。 ·doi:10.1002/0471721182
[28] Miyata,Y.(2011):“具有截尾数据的有限混合模型中的最大似然估计量。”J.Stat.Plan。推理,141,56-64·Zbl 1197.62026号
[29] Murphy,K.E.(2012):《机器学习:概率观点》,麻省理工学院出版社·Zbl 1295.68003号
[30] Murphy,S.A.和A.W.Van Der Vaart(2000):“侧面可能性”,《美国法律总汇》,第95449-465页·Zbl 0995.62033号
[31] Neal,R.M.(2000):《Dirichlet过程混合模型的马尔可夫链抽样方法》,《计算杂志》。图表。统计,9,249-265。
[32] Pan,W.,J.Lin和C.T.Le(2003):“用微阵列数据检测差异表达基因的混合模型方法。”。集成。基因组学,3117-124。
[33] Pearson,K.(1894):《进化数学理论的贡献》,Proc。R.Soc.伦敦。数学。物理学。科学。,185, 71-110. ·JFM 25.0347.02号
[34] Pyne,S.,X.Hu,K.Wang,E.Rossin,T.I.Lin,L.M.Maier,C.Baecher-Allan,G.J.McLachlan,P.Tamayo,D.A.Hafler,P.L.De Jager和J.P.Mesirov(2009):“自动化高维流式细胞术数据分析”。国家。阿卡德。科学。美国,106,8519-8124。
[35] Pyne,S.,S.X.Lee,K.Wang,J.Irish,P.Tamayo,M.D.Nazaire,T.Duong,S.K.Ng,D.Hafler,R.Levy,G.P.Nolan,J.Mesirov和G.J.McLachlan(2014):“高维流式细胞术数据队列中细胞群的联合建模和注册”,《公共科学图书馆·综合》,第9期,第100334页。
[36] Quandt,R.E.和J.B.Ramsey(1978):“估计正态分布和切换回归的混合物”,《美国统计协会期刊》,第73期,第730-738页·Zbl 0401.62024号
[37] Rasmussen,C.E.(2000):“无限高斯混合模型”。摘自:高级神经网络过程系统。编辑:S.A.Solla、T.K.Leen和K.R.Müller。第12卷。麻省理工学院出版社,第554-560页。
[38] Schwarz,G.(1978):“估算模型的维数”,《美国统计年鉴》,第6卷,第461-464页·Zbl 0379.62005年
[39] Sudderth,E.、A.Torralba、W.T.Freeman和A.S.Willsky(2006):“熟悉对象的深度:3D场景的层次模型”。IEEE计算。Soc.Conf.计算。视觉。模式识别。
[40] Tanaka,K.和A.Takemura(2006):“当尺度参数指数小时,有限位置尺度混合的MLE的强一致性。”Bernoulli(Andover),121003-2017·Zbl 1117.62025号
[41] Venzon,D.J.和S.H.Moolgavkar(1988年):“基于轮廓的置信区间计算方法”,J.R.Stat.Soc.Ser。C申请。统计,37,87-94。
[42] Wang,H.和S.Huang(2007):“DNA含量分析中的混合模型分类”,《细胞计量学A》,71,716-723。
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。