保拉·默里(Paula M.Murray)。;Ryan P.布朗。;保罗·D·麦克尼古拉斯。 斜交因子分析仪的混合物。 (英语) Zbl 1506.62132号 计算。统计数据分析。 77, 326-335 (2014). 小结:介绍了一种混合斜因子分析仪以及一系列基于该分析仪的混合模型。所使用的斜(t)分布的特定公式是广义双曲分布的特例。像它们的高斯和(t)分布类似物一样,斜(t)因子分析器的混合物非常适合于基于模型的高维数据聚类。模型参数估计采用交替期望条件最大化算法,模型选择采用贝叶斯信息准则。这些模型应用于真实数据和模拟数据,与公认的高斯混合模型家族相比,可以获得更好的聚类结果。 引用于52文件 MSC公司: 62-08 统计问题的计算方法 62小时30分 分类和区分;聚类分析(统计方面) 关键词:群集;因子分析;高维数据;混合物模型;基于模型的聚类;MSTFA公司;偏斜混合物;斜交-(t)混合物 软件:群集查找;麦克卢斯特;对;PGMM公司 PDF格式BibTeX公司 XML格式引用 \textit{P.M.Murray}等人,计算。统计数据分析。77、326--335(2014;Zbl 1506.62132) 全文: 内政部 arXiv公司 参考文献: [1] Aas,K。;Haff,I.H.,《广义双曲偏态学生t分布》,J.Financ。经济。,4, 2, 275-309, (2006) [2] 艾特肯,A.C.,关于伯努利代数方程的数值解,Proc。罗伊。爱丁堡州立大学,46,289-305,(1926)·JFM 52.0098.05号 [3] 安德鲁斯,J.L。;McNicholas,P.D.,《多元因子分析仪的扩展混合》,统计计算。,21, 3, 361-373, (2011) ·Zbl 1255.62175号 [4] Azzalini,A.,Browne,R.P.,Genton,M.G.,McNicholas,P.D.,2014年。比较两种倾斜分布公式,特别参考基于模型的聚类。arxiv:1402.5431。 [5] 巴恩多夫-尼尔森,O。;Halgreen,C.,双曲和广义逆高斯分布的无限可除性,Z.Wahrscheinlichkeits理论。Verwandte Geb.公司。,38, 309-311, (1977) ·Zbl 0403.60026号 [6] 巴恩多夫-尼尔森,O。;Shephard,N.,非高斯-奥恩斯坦-乌伦贝克模型及其在金融经济学中的一些应用,J.Roy。统计师。Soc.序列号。B、 63、167-241(2001)·Zbl 0983.60028号 [7] Blsild,P.,广义逆高斯分布和双曲线分布的形状,(研究报告37,(1978),丹麦奥胡斯大学理论统计系) [8] Böhning博士。;迪茨,E。;Schaub,R。;施拉特曼,P。;Lindsay,B.,《单参数指数族密度混合物的似然比分布》,《Ann.Inst.Statist》。数学。,46, 373-388, (1994) ·Zbl 0802.62017年 [9] Branco,M。;Dey,D.,一类一般的多元偏椭圆分布,J.多元分析。,79, 99-113, (2001) ·Zbl 0992.62047号 [10] Browne,R.P.,McNicholas,P.D.,2013年。广义双曲分布的混合。arXiv预打印arXiv:1305.1036。 [11] Browne,R.P。;医学博士麦克尼古拉斯。;Sparling,M.D.,使用高斯和均匀分布混合的基于模型的学习,IEEE Trans。模式分析。机器。智力。,34, 4, 814-817, (2012) [12] 坎贝尔,J。;弗雷利,C。;默塔格,F。;Raftery,A.,《使用基于模型的聚类对机织物进行线性缺陷检测》,《模式识别》。莱特。,18, 1539-1548, (1997) [13] Dasgupta,A。;Raftery,A.E.,《通过基于模型的聚类检测杂波处理的空间点特征》,J.Amer。统计师。协会,93294-302,(1998)·Zbl 0906.62105号 [14] Dempster,A.P。;新墨西哥州莱尔德。;Rubin,D.B.,《通过EM算法从不完整数据中获得最大似然》,J.Roy。统计师。Soc.序列号。B、 39,1,1-38,(1977年)·Zbl 0364.62022号 [15] 弗雷利,C。;Raftery,A.E.,MCLUST:基于模型的聚类分析软件,分类杂志,16297-306,(1999)·Zbl 0951.91500号 [16] Franczak,B。;Browne,R.P。;McNicholas,P.D.,移位非对称拉普拉斯分布的混合,IEEE Trans。模式分析。机器。智力。,(2014),(出版中) [17] 不列颠哥伦比亚省Franczak、P.D.McNicholas、R.B.Browne、P.M.Murray,2013年。节俭的不对称拉普拉斯变换混合物。Arxiv预打印Arxiv:1311.0317。 [18] 加赫拉马尼,Z。;Hinton,G.,因子分析仪的EM算法,(技术报告CRG-TR-96-1,(1997),多伦多大学多伦多分校) [19] Golub,T。;斯隆,D。;Tamayo,P。;华德,C。;加森贝克,M。;梅西洛夫,J。;科勒,H。;卢,M。;唐宁,J。;Caligiuri,M。;布隆菲尔德,C。;Lander,E.,《癌症的分子分类:通过基因表达监测进行分类发现和分类预测》,《科学》,286531-537,(1999) [20] Good,I,J.,《物种的种群频率和种群参数的估计》,《生物统计学》,40,237-260,(1953)·Zbl 0051.37103号 [21] Halgreen,C.,广义逆高斯分布和双曲分布的自分解性,Z.Wahrscheinlichkeits理论。Verwandte Geb.公司。,47, 13-18, (1979) ·Zbl 0377.60020号 [22] 哈斯蒂,T。;Tibshirani,R.,《高斯混合判别分析》,J.Roy。统计师。Soc.序列号。B、 58155-176(1996)·Zbl 0850.62476号 [23] 休伯特,L。;Arabie,P.,比较分区,J.分类,2193-218,(1985) [24] 琼斯,M。;Faddy,M.,《(t)分布的一种斜扩展及其应用》,J.Roy。统计师。Soc.序列号。B、 65、159-174(2003)·Zbl 1063.62013年 [25] Jörgensen,B.,广义逆高斯分布的统计特性,(1982),Springer-Verlag纽约·兹比尔04866.222 [26] Karlis,D。;Meligkotsidou,L.,多元泊松分布的有限混合及其应用,J.Statist。计划。推理,137,6,1942-1960,(2007)·Zbl 1116.60006号 [27] 考夫曼,L。;Rousseeuw,P.J.,《在数据中发现群体:聚类分析导论》(1990),威利纽约·Zbl 1345.62009号 [28] Lee,S.,McLachlan,G.J.,2012年。关于通过EM算法拟合多元斜t分布的混合物。arxiv:1109.4706。 [29] Lee,S.X。;McLachlan,G.J.,《关于斜正态分布和斜t分布的混合》,《高级数据分析》。分类。,7, 3, 241-266, (2013) ·Zbl 1273.62115号 [30] Lin,T.-I.,多元正态混合模型的最大似然估计,多元分析杂志。,100, 257-265, (2009) ·Zbl 1152.62034号 [31] Lin,T.-I.,McLachlan,G.J.,Lee,S.X.,2013年。使用受限多元偏态分布扩展因子模型的混合。arxiv:1307.1748。 [32] Lindsay,B.G.,《混合模型:理论、几何学和应用》,(NSF-CBMS概率统计区域会议系列,第5卷,(1995),加利福尼亚州海沃德数学统计研究所),63-65·兹比尔1163.62326 [33] Lopes,H.F。;West,M.,因子分析中的贝叶斯模型评估,统计学。中国科学院,14,41-67,(2004)·Zbl 1035.62060号 [34] 马云(Ma,Y.)。;Genton,M.,一类灵活的斜对称分布,扫描。《美国法律总汇》第31卷,第459-468页,(2004年)·Zbl 1063.62079号 [35] 麦克拉克伦,G.J。;比恩,R.W。;Jones,L.B.-T.,将混合因子分析模型扩展为包含多元T分布,计算。统计师。数据分析。,51, 11, 5327-5338, (2007) ·Zbl 1445.62053号 [36] 麦克拉克伦,G.J。;比恩,R.W。;Peel,D.,基于混合模型的微阵列表达数据聚类方法,生物信息学,18,3,413-422,(2002) [37] 麦克拉克伦,G.J。;Krishnan,T.,《EM算法和扩展》(2008),威利纽约·Zbl 1165.62019号 [38] 麦克拉克伦,G.J。;Peel,D.,《因子分析仪的混合物》(第七届机器学习国际会议,旧金山,(2000)) [39] McNicholas,P.D.,使用潜在高斯混合模型的基于模型的分类,J.Statist。计划。推理,140,5,1175-1181,(2010)·Zbl 1181.62095号 [40] McNicholas,P.D.,Jampani,K.R.,McDaid,A.F.,Murphy,T.B.,Banks,L.,2011年。pgmm:简约高斯混合模型。R软件包版本1.0。 [41] 医学博士麦克尼古拉斯。;Murphy,T.B.,简约高斯混合模型,统计计算。,18, 285-296, (2008) [42] 医学博士麦克尼古拉斯。;Murphy,T.B.,通过潜在高斯混合模型对微阵列表达数据进行基于模型的聚类,生物信息学,26,21,2705-2712,(2010) [43] 医学博士麦克尼古拉斯。;Murphy,T.B.,《基于模型的纵向数据聚类》,加拿大。J.统计。,38, 1, 153-168, (2010) ·Zbl 1190.62120号 [44] 医学博士麦克尼古拉斯。;墨菲,T.B。;麦克戴德,A.F。;Frost,D.,通过简约高斯混合模型实现基于模型的聚类的串行和并行实现,计算。统计师。数据分析。,54, 3, 711-723, (2010) ·Zbl 1464.62131号 [45] 医学博士麦克尼古拉斯。;Subedi,S.,使用多元t分布混合物聚类基因表达时间过程数据,J.Statist。计划。推理,142,5,1114-1127,(2012)·Zbl 1236.62068号 [46] 孟,X.-L。;Rubin,D.,《通过ECM算法的最大似然估计:一般框架》,《生物特征识别》,80,267-278,(1993)·Zbl 0778.62022号 [47] 孟,X.-L。;van Dyk,D.,《EM算法》(The EM algorithm),J·罗伊(J.Roy),一首旧民歌,以快速的新曲调演唱(带讨论)。统计师。Soc.序列号。B、 59、511-567(1997)·Zbl 1090.62518号 [48] Montanari,A。;Viroli,C.,《学生对大学课程满意度分析的偏态因子模型》,J.Appl。Stat.,37,3,473-487,(2010年)·Zbl 1511.62401号 [49] 莫里斯,K。;McNicholas,P.D.,通过移位非对称拉普拉斯分布的混合物实现基于模型的聚类的降维,Statist。普罗巴伯。莱特。,83, 9, 2088-2093, (2013) ·兹比尔1282.62153 [50] 莫里斯,K。;医学博士麦克尼古拉斯。;Scrucca,L.,《通过多元t分布混合物进行基于模型聚类的降维》,《高级数据分析》。分类。,7, 3, 321-338, (2013) ·Zbl 1273.62141号 [51] P.M.Murray,R.P.Browne,P.D.McNicholas,2013a。偏t因子分析仪的混合物。arxiv:1305.4301。 [52] P.M.Murray,R.P.Browne,P.D.McNicholas,2013b。“无限制”偏态t因子分析仪的混合物。arxiv:1310.6224。 [53] 莫里,P.M。;医学博士麦克尼古拉斯。;Browne,R.P.,常见偏斜因子分析仪的混合物,Stat,3,1,68-82,(2014) [54] Nakai,K。;Kanehisa,M.,预测革兰氏阴性菌中蛋白质定位位点的专家系统,Prot.:结构。功能。生物信息。,11, 2, 95-110, (1991) [55] Nakai,K。;Kanehisa,M.,预测真核细胞蛋白质定位位点的知识库,基因组学,14897-911,(1992),mEDLINE摘要 [56] 皮,D。;McLachlan,G.J.,使用t分布的稳健混合建模,统计计算。,10, 4, 339-348, (2000) [57] R核心团队。2013.R:统计计算语言和环境。R统计计算基金会,奥地利维也纳。 [58] Sahu,S。;戴伊·D。;Branco,M.,一类新的多元偏态分布及其在贝叶斯回归模型中的应用,Canad。J.统计。,31, 129-150, (2003) ·Zbl 1039.62047号 [59] Schwarz,G.,估算模型的维数,Ann.Statist。,6, 461-464, (1978) ·Zbl 0379.62005年 [60] 斯皮尔曼,C.,《两个事物之间关联的证明和测量》,美国心理学杂志。,15, 1, 72-101, (1904) [61] 倾翻,T。;Bishop,C.,概率成分分析仪的混合物,神经计算。,11, 2, 443-482, (1999) [62] Tortora,C.,McNicholas,P.D.,Browne,R.P.,2013年。广义双曲因子分析仪的混合物。arxiv:1311.6530。 [63] 弗瑞克,I。;McNicholas,P.D.,多元偏态模型EM算法的分析计算,统计学。普罗巴伯。莱特。,82, 6, 1169-1174, (2012) ·Zbl 1244.65012号 [64] 弗瑞克,I。;McNicholas,P.D.,用于基于模型的聚类和分类的解析偏斜混合模型,计算。统计师。数据分析。,71, 196-210, (2014) ·Zbl 1471.62202号 [65] Woodbury,M.,《反演修正矩阵》(技术报告42,(1950),新泽西州普林斯顿大学) [66] 周,H。;Lange,K.L.,《在通往主导模式的崎岖道路上》,Scand。J.Stat.,37,4,612-631,(2010年)·Zbl 1226.62027号 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。