×

多元偏斜Student(t)分布与独立logistic偏斜函数的有限混合。 (英语) Zbl 1496.62091号

摘要:本文利用引入的独立logistic偏斜函数(MSTIL)扩展了多元偏斜(t)分布[H.S.Kwong先生S.Nadarajah公司、Methodol。计算。申请。普罗巴伯。24,第3期,1669–1691(2022;Zbl 1491.62040号)]有限混合模型(FM-MSTIL)。提出了一种用于FM-MSTIL拟合的随机EM型算法,并提出了一个用于初始化和模型选择的分层次算法。我们表明,对于一些模拟数据集,该模型可以优于文献中的其他有限混合模型。还研究了FM-MSTIL在聚类分析中的性能。我们表明,FM-MSTIL-R是FM-MSTIL的嵌套版本,在FlowCap-I质询中的一些流式细胞术数据集上执行自动选通任务时表现良好。FM-MSTIL-R在最初的挑战中取得了比所有其他竞争算法更好的总分。FM-MSTIL的有效实现可以在GitHub中作为R包提供。

MSC公司:

62H10型 统计的多元分布
60E05型 概率分布:一般理论
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aghaeepour,N.、Finak,G.、Hoos,H.、Mosmann,T.R.、Brinkman,R.、Gottardo,R.和Scheuermann,R.H.(2013)。自动流式细胞术数据分析技术的关键评估。自然方法10, 228-238.
[2] Aghaeepour,N.、Nikolic,R.、Hoos,H.H.和Brinkman,R.R.(2011)。流式细胞术数据中的快速细胞群鉴定。细胞计量学A部分79, 6-13.
[3] Arellano-Valle,R.B.和Genton,M.G.(2005)。关于基本斜分布。多元分析杂志96, 93-116. ·Zbl 1073.62049号 ·doi:10.1016/j.jmva.2004.10.002
[4] Azzalini,A.(1985)。包含正态分布的一类分布。斯堪的纳维亚统计杂志12, 171-178. ·Zbl 0581.62014号
[5] Azzalini,A.和Capitanio,A.(2003)。对称扰动产生的分布,强调多元斜t分布。英国皇家统计学会杂志,B辑,统计方法65, 367-389. ·兹比尔1065.62094 ·数字对象标识代码:10.1111/1467-9868.00391
[6] Basso,R.M.、Lachos,V.H.、Cabral,C.R.B.和Ghosh,P.(2010年)。基于偏态正态分布比例混合的稳健混合建模。计算统计学与数据分析54, 2926-2941. ·Zbl 1284.62193号 ·doi:10.1016/j.csda.2009.09.031
[7] Biernacki,C.、Celeux,G.和Govaert,G.(2000)。用综合完全似然法评估用于聚类的混合模型。IEEE模式分析和机器智能汇刊22, 719-725.
[8] Bilmes,J.、Asanovic,K.、Chin,C.-W.和Demmel,J.(1997)。使用PHiPAC加快错误反向传播学习。1997年IEEE声学、语音和信号处理国际会议论文集,第5卷, 4153-4156.
[9] Branco,M.D.和Dey,D.K.(2001年)。一类一般的多元偏椭圆分布。多元分析杂志79, 99-113. ·Zbl 0992.62047号 ·doi:10.1006/jmva.2000.1960
[10] Cabral,C.R.B.、Lachos,V.H.和Prates,M.O.(2012年)。使用非正态独立分布的多元混合建模。计算统计学与数据分析56, 126-142. ·Zbl 1239.62058号 ·doi:10.1016/j.csda.2011.06.026
[11] Dempster,A.P.、Laird,N.M.和Rubin,D.B.(1977年)。通过EM算法从不完整数据中获得最大似然。英国皇家统计学会杂志,B辑(方法学)39,1-22·Zbl 0364.62022号
[12] Frühwirth-Schnatter,S.和Pyne,S.(2010年)。单变量和多元偏正态和偏t分布有限混合的贝叶斯推断。生物统计学11, 317-336. ·Zbl 1437.62465号
[13] Hartigan,J.A.(1975年)。聚类算法纽约:John Wiley and Sons·Zbl 0372.62040号
[14] Ho,H.J.、Pyne,S.和Lin,T.I.(2012)。通过实际EM型算法对斜交Student-t-正态分布的混合进行最大似然推断。统计与计算22, 287-299. ·Zbl 1322.62087号 ·doi:10.1007/s11222-010-9225-9
[15] Kwong,H.S.和Nadarajah,S.(2022年)。一类新的稳健的斜椭圆分布。应用概率的方法与计算1669-1691年4月24日·Zbl 1491.62040号 ·doi:10.1007/s11009-021-09883-5
[16] Lee,S.X.和McLachlan,G.J.(2011)。关于通过EM算法拟合多元斜t分布的混合物。ArXiv预印本。可从ArXiv:1109.4706获得·Zbl 1325.62107号 ·doi:10.1007/s11222-012-9362-4
[17] Lee,S.X.和McLachlan,G.J.(2014)。多元斜t分布的有限混合:一些最新结果。统计与计算24, 181-202. ·Zbl 1325.62107号 ·doi:10.1007/s11222-012-9362-4
[18] Lee,S.X.和McLachlan,G.J.(2016)。规范基本斜t分布的有限混合:限制和非限制斜t混合模型的统一。统计与计算26, 573-589. ·Zbl 1420.60020号 ·doi:10.1007/s11222-015-9545-x
[19] Lee,S.X.和McLachlan,G.J.(2018年)。EMMIXcskew:一个R包,用于拟合混合的典型基本斜t分布。统计软件杂志83, 1-32. ·Zbl 1420.60020号 ·doi:10.1007/s11222-015-9545-x
[20] Lin,T.I.(2010)。使用多元斜t分布的稳健混合建模。统计与计算20, 343-356. ·doi:10.1007/s11222-009-9128-9
[21] Lin,T.I.,Lee,J.C.和Hsieh,W.J.(2007)。使用偏斜t分布的稳健混合建模。统计与计算17, 81-92. ·doi:10.1007/s11222-006-9005-8
[22] Lin,T.I.、Lee,J.C.和Yen,S.Y.(2007)。使用斜正态分布的有限混合建模。中国统计局17, 909-927. ·Zbl 1133.62012年
[23] McLachlan,G.J.、Lee,S.X和Rathnayake,S.I.(2019年)。有限混合模型。统计年鉴及其应用6, 355-378. ·doi:10.1146/annurev-statistics-031017-100325
[24] 纽科姆·S(1886)。为了获得最佳结果而组合观测的广义理论。美国数学杂志8, 343-366. ·JFM 18.0183.01号 ·doi:10.2307/2369392
[25] 皮尔逊,K.(1894年)。对进化数学理论的贡献。英国皇家学会哲学学报A辑第185页,第71-110页·JFM 25.0347.02号
[26] Povey,D.、Burget,L.、Agarwal,M.、Akyazi,P.、Feng,K.、Ghoshal,A.、Glembek,O.、Goel,N.K.、Karafiát,M.,Rastrow,A.、Rose,R.C.、Schwarz,P.和Thomas,S.(2010年)。语音识别的子空间高斯混合模型。2010年IEEE声学、语音和信号处理国际会议记录, 4330-4333.
[27] Pyne,S.、Hu,X.、Wang,K.、Rossin,E.、Lin,T.-I.、Maiera,L.M.、Baecher-Allan,C.、McLachlan,G.J.、Tamayo,P.、Hafler,D.A.、Jagera,P.L.和Mesirov,J.P.(2009)。自动化高维流式细胞术数据分析。美国国家科学院院刊106, 8519-8524.
[28] Qian,Y.、Wei,C.、Lee,F.E.-H.、Campbell,J.、Halliley,J.,Lee,J.A.、Cai,J.和Kong,Y.M.、Sadat,E.、Thomson,E.、Dunn,P.、Seegmiller,A.C.、Karandikar,N.J.、Tipton,C.M.、Mosmann,T.、Sanz,I.和Scheuermann,R.H.(2010)。使用基于密度的方法对17个人类外周血B细胞亚群进行说明,并量化破伤风反应,以自动识别多维流式细胞术数据中的细胞群。细胞计量学B部分:临床细胞计量学78,S69-S82。
[29] R核心团队(2022)。R: 统计计算语言与环境奥地利维也纳:R统计计算基金会。
[30] Reynolds,D.A.和Rose,R.C.(1995年)。使用高斯混合说话人模型的鲁棒文本相关说话人识别。IEEE语音和音频处理汇刊3, 72-83.
[31] Sahu,S.K.、Dey,D.K.和Branco,M.D.(2003)。一类新的多元偏斜分布及其在贝叶斯回归模型中的应用。加拿大统计杂志31, 129-150. ·Zbl 1039.62047号 ·doi:10.2307/3316064
[32] Schwarz,G.(1978年)。估算模型的维度。统计年鉴6, 461-464 ·兹伯利0379.62005 ·doi:10.1214/aos/1176344136
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。