×

斜交因子分析仪的混合物。 (英语) Zbl 1506.62132号

小结:介绍了一种混合斜因子分析仪以及一系列基于该分析仪的混合模型。所使用的斜(t)分布的特定公式是广义双曲分布的特例。像它们的高斯和(t)分布类似物一样,斜(t)因子分析器的混合物非常适合于基于模型的高维数据聚类。模型参数估计采用交替期望条件最大化算法,模型选择采用贝叶斯信息准则。这些模型应用于真实数据和模拟数据,与公认的高斯混合模型家族相比,可以获得更好的聚类结果。

MSC公司:

62-08 统计问题的计算方法
62小时30分 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Aas,K。;Haff,I.H.,《广义双曲偏态学生t分布》,J.Financ。经济。,4, 2, 275-309, (2006)
[2] 艾特肯,A.C.,关于伯努利代数方程的数值解,Proc。罗伊。爱丁堡州立大学,46,289-305,(1926)·JFM 52.0098.05号
[3] 安德鲁斯,J.L。;McNicholas,P.D.,《多元因子分析仪的扩展混合》,统计计算。,21, 3, 361-373, (2011) ·Zbl 1255.62175号
[4] Azzalini,A.,Browne,R.P.,Genton,M.G.,McNicholas,P.D.,2014年。比较两种倾斜分布公式,特别参考基于模型的聚类。arxiv:1402.5431。
[5] 巴恩多夫-尼尔森,O。;Halgreen,C.,双曲和广义逆高斯分布的无限可除性,Z.Wahrscheinlichkeits理论。Verwandte Geb.公司。,38, 309-311, (1977) ·Zbl 0403.60026号
[6] 巴恩多夫-尼尔森,O。;Shephard,N.,非高斯-奥恩斯坦-乌伦贝克模型及其在金融经济学中的一些应用,J.Roy。统计师。Soc.序列号。B、 63、167-241(2001)·Zbl 0983.60028号
[7] Blsild,P.,广义逆高斯分布和双曲线分布的形状,(研究报告37,(1978),丹麦奥胡斯大学理论统计系)
[8] Böhning博士。;迪茨,E。;Schaub,R。;施拉特曼,P。;Lindsay,B.,《单参数指数族密度混合物的似然比分布》,《Ann.Inst.Statist》。数学。,46, 373-388, (1994) ·Zbl 0802.62017年
[9] Branco,M。;Dey,D.,一类一般的多元偏椭圆分布,J.多元分析。,79, 99-113, (2001) ·Zbl 0992.62047号
[10] Browne,R.P.,McNicholas,P.D.,2013年。广义双曲分布的混合。arXiv预打印arXiv:1305.1036。
[11] Browne,R.P。;医学博士麦克尼古拉斯。;Sparling,M.D.,使用高斯和均匀分布混合的基于模型的学习,IEEE Trans。模式分析。机器。智力。,34, 4, 814-817, (2012)
[12] 坎贝尔,J。;弗雷利,C。;默塔格,F。;Raftery,A.,《使用基于模型的聚类对机织物进行线性缺陷检测》,《模式识别》。莱特。,18, 1539-1548, (1997)
[13] Dasgupta,A。;Raftery,A.E.,《通过基于模型的聚类检测杂波处理的空间点特征》,J.Amer。统计师。协会,93294-302,(1998)·Zbl 0906.62105号
[14] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,《通过EM算法从不完整数据中获得最大似然》,J.Roy。统计师。Soc.序列号。B、 39,1,1-38,(1977年)·Zbl 0364.62022号
[15] 弗雷利,C。;Raftery,A.E.,MCLUST:基于模型的聚类分析软件,分类杂志,16297-306,(1999)·Zbl 0951.91500号
[16] Franczak,B。;Browne,R.P。;McNicholas,P.D.,移位非对称拉普拉斯分布的混合,IEEE Trans。模式分析。机器。智力。,(2014),(出版中)
[17] 不列颠哥伦比亚省Franczak、P.D.McNicholas、R.B.Browne、P.M.Murray,2013年。节俭的不对称拉普拉斯变换混合物。Arxiv预打印Arxiv:1311.0317。
[18] 加赫拉马尼,Z。;Hinton,G.,因子分析仪的EM算法,(技术报告CRG-TR-96-1,(1997),多伦多大学多伦多分校)
[19] Golub,T。;斯隆,D。;Tamayo,P。;华德,C。;加森贝克,M。;梅西洛夫,J。;科勒,H。;卢,M。;唐宁,J。;Caligiuri,M。;布隆菲尔德,C。;Lander,E.,《癌症的分子分类:通过基因表达监测进行分类发现和分类预测》,《科学》,286531-537,(1999)
[20] Good,I,J.,《物种的种群频率和种群参数的估计》,《生物统计学》,40,237-260,(1953)·Zbl 0051.37103号
[21] Halgreen,C.,广义逆高斯分布和双曲分布的自分解性,Z.Wahrscheinlichkeits理论。Verwandte Geb.公司。,47, 13-18, (1979) ·Zbl 0377.60020号
[22] 哈斯蒂,T。;Tibshirani,R.,《高斯混合判别分析》,J.Roy。统计师。Soc.序列号。B、 58155-176(1996)·Zbl 0850.62476号
[23] 休伯特,L。;Arabie,P.,比较分区,J.分类,2193-218,(1985)
[24] 琼斯,M。;Faddy,M.,《(t)分布的一种斜扩展及其应用》,J.Roy。统计师。Soc.序列号。B、 65、159-174(2003)·Zbl 1063.62013年
[25] Jörgensen,B.,广义逆高斯分布的统计特性,(1982),Springer-Verlag纽约·兹比尔04866.222
[26] Karlis,D。;Meligkotsidou,L.,多元泊松分布的有限混合及其应用,J.Statist。计划。推理,137,6,1942-1960,(2007)·Zbl 1116.60006号
[27] 考夫曼,L。;Rousseeuw,P.J.,《在数据中发现群体:聚类分析导论》(1990),威利纽约·Zbl 1345.62009号
[28] Lee,S.,McLachlan,G.J.,2012年。关于通过EM算法拟合多元斜t分布的混合物。arxiv:1109.4706。
[29] Lee,S.X。;McLachlan,G.J.,《关于斜正态分布和斜t分布的混合》,《高级数据分析》。分类。,7, 3, 241-266, (2013) ·Zbl 1273.62115号
[30] Lin,T.-I.,多元正态混合模型的最大似然估计,多元分析杂志。,100, 257-265, (2009) ·Zbl 1152.62034号
[31] Lin,T.-I.,McLachlan,G.J.,Lee,S.X.,2013年。使用受限多元偏态分布扩展因子模型的混合。arxiv:1307.1748。
[32] Lindsay,B.G.,《混合模型:理论、几何学和应用》,(NSF-CBMS概率统计区域会议系列,第5卷,(1995),加利福尼亚州海沃德数学统计研究所),63-65·兹比尔1163.62326
[33] Lopes,H.F。;West,M.,因子分析中的贝叶斯模型评估,统计学。中国科学院,14,41-67,(2004)·Zbl 1035.62060号
[34] 马云(Ma,Y.)。;Genton,M.,一类灵活的斜对称分布,扫描。《美国法律总汇》第31卷,第459-468页,(2004年)·Zbl 1063.62079号
[35] 麦克拉克伦,G.J。;比恩,R.W。;Jones,L.B.-T.,将混合因子分析模型扩展为包含多元T分布,计算。统计师。数据分析。,51, 11, 5327-5338, (2007) ·Zbl 1445.62053号
[36] 麦克拉克伦,G.J。;比恩,R.W。;Peel,D.,基于混合模型的微阵列表达数据聚类方法,生物信息学,18,3,413-422,(2002)
[37] 麦克拉克伦,G.J。;Krishnan,T.,《EM算法和扩展》(2008),威利纽约·Zbl 1165.62019号
[38] 麦克拉克伦,G.J。;Peel,D.,《因子分析仪的混合物》(第七届机器学习国际会议,旧金山,(2000))
[39] McNicholas,P.D.,使用潜在高斯混合模型的基于模型的分类,J.Statist。计划。推理,140,5,1175-1181,(2010)·Zbl 1181.62095号
[40] McNicholas,P.D.,Jampani,K.R.,McDaid,A.F.,Murphy,T.B.,Banks,L.,2011年。pgmm:简约高斯混合模型。R软件包版本1.0。
[41] 医学博士麦克尼古拉斯。;Murphy,T.B.,简约高斯混合模型,统计计算。,18, 285-296, (2008)
[42] 医学博士麦克尼古拉斯。;Murphy,T.B.,通过潜在高斯混合模型对微阵列表达数据进行基于模型的聚类,生物信息学,26,21,2705-2712,(2010)
[43] 医学博士麦克尼古拉斯。;Murphy,T.B.,《基于模型的纵向数据聚类》,加拿大。J.统计。,38, 1, 153-168, (2010) ·Zbl 1190.62120号
[44] 医学博士麦克尼古拉斯。;墨菲,T.B。;麦克戴德,A.F。;Frost,D.,通过简约高斯混合模型实现基于模型的聚类的串行和并行实现,计算。统计师。数据分析。,54, 3, 711-723, (2010) ·Zbl 1464.62131号
[45] 医学博士麦克尼古拉斯。;Subedi,S.,使用多元t分布混合物聚类基因表达时间过程数据,J.Statist。计划。推理,142,5,1114-1127,(2012)·Zbl 1236.62068号
[46] 孟,X.-L。;Rubin,D.,《通过ECM算法的最大似然估计:一般框架》,《生物特征识别》,80,267-278,(1993)·Zbl 0778.62022号
[47] 孟,X.-L。;van Dyk,D.,《EM算法》(The EM algorithm),J·罗伊(J.Roy),一首旧民歌,以快速的新曲调演唱(带讨论)。统计师。Soc.序列号。B、 59、511-567(1997)·Zbl 1090.62518号
[48] Montanari,A。;Viroli,C.,《学生对大学课程满意度分析的偏态因子模型》,J.Appl。Stat.,37,3,473-487,(2010年)·Zbl 1511.62401号
[49] 莫里斯,K。;McNicholas,P.D.,通过移位非对称拉普拉斯分布的混合物实现基于模型的聚类的降维,Statist。普罗巴伯。莱特。,83, 9, 2088-2093, (2013) ·兹比尔1282.62153
[50] 莫里斯,K。;医学博士麦克尼古拉斯。;Scrucca,L.,《通过多元t分布混合物进行基于模型聚类的降维》,《高级数据分析》。分类。,7, 3, 321-338, (2013) ·Zbl 1273.62141号
[51] P.M.Murray,R.P.Browne,P.D.McNicholas,2013a。偏t因子分析仪的混合物。arxiv:1305.4301。
[52] P.M.Murray,R.P.Browne,P.D.McNicholas,2013b。“无限制”偏态t因子分析仪的混合物。arxiv:1310.6224。
[53] 莫里,P.M。;医学博士麦克尼古拉斯。;Browne,R.P.,常见偏斜因子分析仪的混合物,Stat,3,1,68-82,(2014)
[54] Nakai,K。;Kanehisa,M.,预测革兰氏阴性菌中蛋白质定位位点的专家系统,Prot.:结构。功能。生物信息。,11, 2, 95-110, (1991)
[55] Nakai,K。;Kanehisa,M.,预测真核细胞蛋白质定位位点的知识库,基因组学,14897-911,(1992),mEDLINE摘要
[56] 皮,D。;McLachlan,G.J.,使用t分布的稳健混合建模,统计计算。,10, 4, 339-348, (2000)
[57] R核心团队。2013.R:统计计算语言和环境。R统计计算基金会,奥地利维也纳。
[58] Sahu,S。;戴伊·D。;Branco,M.,一类新的多元偏态分布及其在贝叶斯回归模型中的应用,Canad。J.统计。,31, 129-150, (2003) ·Zbl 1039.62047号
[59] Schwarz,G.,估算模型的维数,Ann.Statist。,6, 461-464, (1978) ·Zbl 0379.62005年
[60] 斯皮尔曼,C.,《两个事物之间关联的证明和测量》,美国心理学杂志。,15, 1, 72-101, (1904)
[61] 倾翻,T。;Bishop,C.,概率成分分析仪的混合物,神经计算。,11, 2, 443-482, (1999)
[62] Tortora,C.,McNicholas,P.D.,Browne,R.P.,2013年。广义双曲因子分析仪的混合物。arxiv:1311.6530。
[63] 弗瑞克,I。;McNicholas,P.D.,多元偏态模型EM算法的分析计算,统计学。普罗巴伯。莱特。,82, 6, 1169-1174, (2012) ·Zbl 1244.65012号
[64] 弗瑞克,I。;McNicholas,P.D.,用于基于模型的聚类和分类的解析偏斜混合模型,计算。统计师。数据分析。,71, 196-210, (2014) ·Zbl 1471.62202号
[65] Woodbury,M.,《反演修正矩阵》(技术报告42,(1950),新泽西州普林斯顿大学)
[66] 周,H。;Lange,K.L.,《在通往主导模式的崎岖道路上》,Scand。J.Stat.,37,4,612-631,(2010年)·Zbl 1226.62027号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。