×

扩展混合因子分析模型以纳入多元(t)分布。 (英语) Zbl 1445.62053号

小结:因子分析仪的混合使得可以对高维数据进行基于模型的密度估计,其中观测值的数量相对于其维(p)来说很小。然而,这种方法对离群值很敏感,因为它基于一个混合模型,其中假设分量误差和因子分布为多元正态分布族。考虑了对混合(t)因子分析器的扩展,其中多元(t)族被用于分量误差和因子分布。提出了一种基于EM的混合因子分析仪拟合算法。它在一些微阵列基因表达数据的聚类中得到了证明。

MSC公司:

62层25 参数公差和置信区间
62G07年 密度估算
62H30型 分类和区分;聚类分析(统计方面)
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Banfield,J.D。;Raftery,A.E.,基于模型的高斯和非高斯聚类,生物统计学,49,803-821(1993)·Zbl 0794.62034号
[2] Böhning,D.,《混合物的计算机辅助分析和应用:荟萃分析、疾病绘图和其他》(1999),查普曼和霍尔,CRC:查普曼&霍尔,纽约CRC
[3] 科尔曼,D。;Dong,X。;哈丁,J。;Roke,D.M。;Woodruff,D.L.,无先验度量的聚类分析中的一些计算问题,计算。统计师。数据分析。,31, 1-11 (1999) ·Zbl 0942.62068号
[4] 邓普斯特,美联社。;新墨西哥州莱尔德。;Rubin,D.B.,《通过EM算法从不完整数据中获得最大似然》(经讨论),J.Roy。统计师。Soc.序列号。B、 39、1-38(1977年)·Zbl 0364.62022号
[5] 埃弗里特,B.S。;Hand,D.J.,有限混合分布(1981),查普曼和霍尔:查普曼与霍尔伦敦·Zbl 0466.62018号
[6] Fokoué,E。;Titterington,D.M.,因子分析仪的混合物。随机模拟的贝叶斯估计和推理,马赫。学习,50,73-94(2002)·Zbl 1033.68085号
[7] Hathaway,R.J.,正态混合分布最大似然估计的约束公式,《统计年鉴》。,13, 795-800 (1985) ·Zbl 0576.62039号
[8] Hennig,C.,位置-尺度混合最大似然估计的分解点,Ann.Statist。,32, 1313-1340 (2004) ·兹比尔1047.62063
[9] Ingrassia,S.,多元正态混合模型的一种基于似然的约束算法,Statist。应用方法。,13, 151-166 (2004) ·Zbl 1205.62066号
[10] 科茨,S。;Nadarajah,S.,《多元分布及其应用》(2004),剑桥大学出版社:剑桥大学出版社,纽约·Zbl 1100.62059号
[11] Lindsay,B.G.,《混合模型:理论、几何和应用》。NSF-CBMS概率与统计区域会议系列,第5卷(1995年),数理统计研究所和美国统计协会:数理统计学会和美国统计学会,弗吉尼亚州亚历山大
[12] 麦克拉克伦,G.J。;Basford,K.E.,《混合模型:推断和聚类应用》(1988),马塞尔·德克尔:马塞尔·戴克尔纽约·Zbl 0697.62050号
[13] 麦克拉克伦,G.J。;Krishnan,T.,EM算法和扩展(1997),威利:威利纽约·Zbl 0882.62012号
[14] 麦克拉克伦,G.J。;Peel,D.,通过多元分布混合物进行稳健聚类分析,(Amin,A.;Dori,D.;Pudil,P.;Freeman,H.,《计算机科学讲义》(1998),Springer:Springer Berlin),658-666
[15] 麦克拉克伦,G.J。;Peel,D.,有限混合模型(2000),Wiley:Wiley纽约·Zbl 0963.62061号
[16] 麦克拉克伦,G.J。;Peel,D.,因子分析仪的混合物,(Langley,P.,《第十七届国际机器学习会议论文集》(2000),Morgan Kaufmann:Morgan Koufmann San Francisco),599-606
[17] 麦克拉克伦,G.J。;皮,D。;Bean,R.W.,用混合因子分析仪模拟高维数据,计算。统计师。数据分析。,41, 379-388 (2003) ·兹比尔1256.62036
[18] 孟晓乐。;Rubin,D.B.,《通过ECM算法的最大似然估计:一般框架》,《生物特征识别》,80,267-278(1993)·Zbl 0778.62022号
[19] 孟晓乐。;van Dyk,D.,《EM算法》(The EM algorithm),J·罗伊(J.Roy),一首旧民歌,以快速的新曲调演唱(带讨论)。统计师。Soc.序列号。B、 59、511-567(1997)·Zbl 1090.62518号
[20] 皮,D。;McLachlan,G.J.,使用(t)分布的稳健混合建模,统计。计算。,10, 335-344 (2000)
[21] 佩罗,C.M。;Sorlie,T。;艾森,B.M.,《人类乳腺肿瘤的分子肖像》,《自然》,406747-752(2000)
[22] Schwarz,G.,估算模型的维数,Ann.Statist。,6, 461-464 (1978) ·Zbl 0379.62005年
[23] 斯文森,M。;Bishop,C.M.,稳健贝叶斯混合建模,神经计算,64,234-252(2005)
[24] Tipping,M.E.,Bishop,C.M.,1997年。概率主成分分析仪的混合物。伯明翰阿斯顿大学神经计算研究小组第NCRG/97/003号技术报告。;Tipping,M.E.,Bishop,C.M.,1997年。概率主成分分析仪的混合物。伯明翰阿斯顿大学神经计算研究小组第NCRG/97/003号技术报告。
[25] 蒂特林顿,医学博士。;A.F.M.史密斯。;Makov,U.E.,《有限混合分布的统计分析》(1985),Wiley:Wiley纽约·Zbl 0646.62013.中
[26] van de Vijver,M.J。;何,Y.D。;van t Veer,L.J.,基因表达特征作为乳腺癌生存预测因子,新英格兰医学杂志,3471999-2009(2002)
[27] 范特维尔,L.J。;戴,H。;van de Vijver,M.J.,基因表达谱预测乳腺癌的临床结果,Nature,415530-536(2002)
[28] Weigelt,B。;Glas,A.M。;L.F.A.韦塞尔斯。;Witteveen,A.T。;彼得斯,J.L。;van t Veer,L.J.,远处转移的原发性乳腺肿瘤的基因表达谱,Proc。美国国家科学院。美国科学,10015901-15905(2003)
[29] 赵,J。;姜强,(t)分布的概率主成分分析,神经计算,69,2217-2226(2006)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。