安德烈·波兰斯基;Michal Marczyk;莫妮卡·彼得罗夫斯卡;彼得·威德拉克;波兰斯卡,乔安娜 通过动态规划分区初始化单变量高斯、多分量、异方差混合模型的EM算法。 (英语) Zbl 1404.65008号 国际期刊计算。方法 15,第3号,文章ID 1850012,21 p.(2018). 小结:使用EM递归算法估计混合分布参数时,设置参数的初始值对估计的整体质量非常重要。现有方法均不适用于含有大量组分的异方差混合物。基于动态规划将观测范围划分为若干个区间,我们提出了一种新的估计单变量异方差高斯混合模型参数初值的方法。我们评估了动态编程方法的变体,这些变体对应于用于分区的不同评分函数。对于模拟数据集和实际数据集,我们证明了与现有技术相比,该方法具有更高的效率。 引用于1文件 MSC公司: 65C60个 统计中的计算问题(MSC2010) 10层62层 点估计 90立方厘米 动态编程 关键词:高斯混合;EM算法;动态规划;质谱 软件:JAMM公司;麦克卢斯特;Mixmod公司;ElemStatLearn(电子状态学习) PDF格式BibTeX公司 XML格式引用 \textit{A.Polanski}等人,《国际计算杂志》。方法15,第3号,文章ID 1850012,21页(2018;Zbl 1404.65008) 全文: 内政部 arXiv公司 参考文献: [1] Bellman,R.[1961]“关于使用动态编程通过线段近似曲线”,ACM Commun.4(6),284·Zbl 0100.12901号 [2] Biernacki,C.[2004]“使用高斯混合中的轨道特性初始化EM”,《统计计算》14(3),267-279。 [3] Biernacki,C.、Celeux,G.和Govaert,G.[2003]“为EM算法选择初始值,以获得多元高斯混合模型中的最大似然”,计算。统计数据分析41(3-4),561-575·Zbl 1429.62235号 [4] Biernacki,C.、Celeux,G.、Govaert,G.和Langrognet,F.[2006]“使用MIXMOD软件进行基于模型的聚类和判别分析”,计算。统计数据分析51(2),587-600·Zbl 1157.62431号 [5] Bilmes,J.[1998]“关于EM算法及其在高斯混合和隐马尔可夫模型参数估计中的应用的温和教程”,技术报告ICSI-TR-97-021,加利福尼亚大学伯克利分校。 [6] Chylla,R.[2012]“使用在线核磁共振光谱数据库的自适应形状建模对生物混合物进行代谢物分析”,J.Compute。科学。系统。生物学5(1),51。 [7] Eirola,E.和Lendasse,A.[2013]《时间序列建模、预测和插值的高斯混合模型》,载于《智能数据分析进展》第十二卷,编辑:Tucker,A.、Hoppner,F.、Siebes,A.和Swift,S.,第8207卷(斯普林格,柏林,海德堡),第162-173页。 [8] Fraiha Machado,A.、Bonafonte,A.和Queiroz,M.[2013]“频谱包络的参数分解”,IEEE国际标准,声学、语音和信号处理(ICASSP),第571-574页。 [9] Fraley,C.和Raftery,A.[1999]“Mclust:基于模型的聚类分析软件”,J.Classif.16(2),297-306·兹比尔0951.91500 [10] Hastie,T.、Tibshirani,R.和Friedman,J.[2009]《统计学习的要素:数据挖掘、推断和预测》(Springer,Berlin)·兹比尔1273.62005 [11] Hébrail,G.、Hugueney,B.、Lechevallier,Y.和Rossi,F.[2010]“通过聚类和最佳分割对功能数据进行探索性分析”,Neurocomput.73(7-9),1125-1141。 [12] Ibrahim,M.、Lacadie,S.和Ohler,U.[2015]“Jamm:联合分析ngs复制品的峰值发现器”,《生物信息学》31(1),48-55。 [13] Ingrassia,S.[2004]“多元正态混合模型的基于似然的约束算法”,《统计方法应用》13(2)151-166·Zbl 1205.62066号 [14] Karlis,D.和Xekalaki,E.[2003]“为有限混合物的EM算法选择初始值”,Comput。统计数据分析41(34),577-590·Zbl 1429.62082号 [15] Kiefer,J.和Wolfowitz,J.[1956]“无限多附带参数存在时最大似然估计量的一致性”,《数学年鉴》。统计27(4),887-906·Zbl 0073.14701号 [16] Maitra,R.[2009]“初始化分区优化算法”,IEEE/ACM Trans。计算。《生物通报》第6卷第1期,第144-57页。 [17] McLachlan,G.和Peel,D.[1999]“用于拟合法线和\(<mml:math display='inline`overflow='scroll`>\)-分量的emmix算法,”J.Stat.Softw.4(2),1-14。 [18] McLachlan,G.和Peel,D.[2000]“有限混合模型”(Wiley,纽约)·Zbl 0963.62061号 [19] Melnykov,V.和Melnygov,I.[2012]“用未知分量数初始化高斯混合模型中的EM算法”,计算。统计数据分析56(6),1381-1395·Zbl 1246.65025号 [20] O'Hagan,A.、Murphy,T.和Gormley,I.[2012]“通过期望最大化算法拟合混合模型的计算方面”,计算。统计数据分析56(12),3843-3864·Zbl 1255.62180号 [21] Pietrowska,M.、Polanska,J.、Walaszczyk,A.、Wygoda,A.、Rutkowski,T.、Skladowski,K.、Marczak,L.、Stobiecki,M.,Marczyk.、Polanski,A.和Widlak,P.[2011]“通过质谱、基于淋巴细胞的dna断裂修复分析和放射治疗诱导的头颈癌患者急性粘膜反应分析的血浆蛋白质组特征之间的关联”,国际放射杂志。生物学87(7),711-9。 [22] Polanski,A.、Marczyk,M.、Pietrowska,M.、Widlak,P.和Polanska,J.【2015】“用于质谱中高效高斯混合建模的信号划分算法”,PLOS ONE10(7),e0314256·Zbl 1349.62555号 [23] Richardson,S.和Green,P.[1997]“关于成分数量未知的混合物的贝叶斯分析”,J.R.Stat.Soc.B59(4),731-792·Zbl 0891.62020号 [24] Sauve,A.和Speed,T.[2004]《高通量质谱数据的归一化、基线校正和校准》。GENSIPS 2004,基因组信号处理和统计研讨会,美国马里兰州巴尔的摩,2004年5月26日至27日,CD-ROM。 [25] Schwarz,G.[1978]“估算模型的维数”,《统计年鉴》第6卷第2期,第461-464页·Zbl 0379.62005年 [26] Sun,H.和Wang,S.[2011]“测量高斯混合模型中的成分重叠”,Data Min.Knowl。发现23(3),479-502·Zbl 1235.68194号 [27] Yao,W.[2010]“方差不等的正态混合物的剖面似然法”,J.Stat.Plan。推断140(7),2089-298·Zbl 1184.62029号 [28] Zhou,H.和Lange,K.L.[2010]“在通往主导模式的崎岖道路上”,Scand。统计理论应用37(4),612-631·Zbl 1226.62027号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。