×

隐截断双曲分布、其有限混合及其在聚类中的应用。 (英语) Zbl 1403.62028号

摘要:介绍了一种隐截断双曲线(HTH)分布,并将其有限混合用于聚类。给出了HTH分布的随机表示,导出了密度。描述了一种有助于参数估计的层次表示。给出了HTH分布的有限混合,并证明了它们的可识别性。讨论了HTH分布的凸性,这在聚类应用中具有重要意义,并给出了这方面的一些理论结果。讨论了HTH分布与文献中其他偏态分布之间的关系。本文提供了HTH分布及其有限混合用于聚类的示例。

MSC公司:

62E15型 统计学中的精确分布理论
62小时05 多元概率分布的表征与结构理论;连接线
62甲12 多元分析中的估计
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Arellano-Valle,R.B。;阿扎里尼,A.,《关于偏正态分布族的统一》,Scand。《统计杂志》,33,561-574(2006)·Zbl 1117.62051号
[2] Arellano-Valle,R.B。;Bolfarine,H。;Lachos,V.H.,偏正态线性混合模型的贝叶斯推断,J.Appl。《法律总汇》,34663-682(2007)·Zbl 1516.62125号
[3] Arellano-Valle,R.B。;Genton,M.G.,《关于基本偏态分布》,《多元分析杂志》。,96, 93-116 (2005) ·Zbl 1073.62049号
[4] 阿诺德,不列颠哥伦比亚省。;Beaver,R.J.,隐藏截断模型,SankhyáSer。A、 62,23-35(2000年)·Zbl 0973.62041号
[5] 阿诺德,不列颠哥伦比亚省。;Beaver,R.J.,与隐藏截断和/或选择性报告相关的扭曲多元模型(讨论),TEST,11,7-54(2002)·Zbl 1033.62013年
[6] 阿诺德,不列颠哥伦比亚省。;Beaver,R.J。;Groeneveld,R.A。;Meeker,W.Q.,截断二元正态分布的非截断边缘,《心理测量学》,58471-488(1993)·Zbl 0794.62075号
[7] Arslan,O.,《方差——多元斜态正态分布的混合》,Statist。论文,56,353-378(2015)·Zbl 1309.62043号
[8] 阿扎里尼,A。;Browne,R.P。;Genton,M.G。;McNicholas,P.D.,《关于斜分布的两种公式的命名和相对优点》,Statist。普罗巴伯。莱特。,110, 201-206 (2016) ·Zbl 1376.60024号
[9] Banfield,J.D。;Raftery,A.E.,基于模型的高斯和非高斯聚类,生物统计学,49,803-821(1993)·Zbl 0794.62034号
[10] 阿拉巴马州巴里茨。,关于修正贝塞尔函数的乘积,Proc。阿默尔。数学。《社会学杂志》,137189-193(2009)·Zbl 1195.33008号
[11] Barndorff-Nielsen,O.,双曲线分布和双曲线分布,Scand。J.Stat.,151-157(1978)·Zbl 0386.60018号
[12] Browne,R.P。;McNicholas,P.D.,广义双曲分布的混合,Canad。J.统计。,43, 176-198 (2015) ·Zbl 1320.62144号
[13] 坎贝尔,J.G。;弗雷利,C。;默塔格,F。;Raftery,A.E.,《使用基于模型的聚类对机织物进行线性缺陷检测》,《模式识别》。莱特。,18, 1539-1548 (1997)
[14] Celeux,G。;Govaert,G.,高斯简约聚类模型,模式识别。,28, 781-793 (1995)
[15] Celeux,G。;Hurn,M。;Robert,C.P.,混合后验分布的计算和推断困难,J.Amer。统计师。协会,95,957-970(2000)·兹比尔0999.62020
[16] Charytanowicz,M。;Niewczas,J。;Kulczycki,P。;Kowalski,P.A。;卢卡西克,S。;Zak,S.,《x射线图像特征分析的完全梯度聚类算法》,(《生物医学信息技术》,《生物医学中的信息技术,智能和软计算的进展》,第69卷(2010年),施普林格:施普林格柏林/海德堡),15-24
[17] 陈,J。;Tan,X。;Zhang,R.,均值和方差正态混合的推断,统计学。Sinica,18,443-465(2008)·Zbl 1135.62018号
[18] Cramér,H.,《统计学的数学方法》(1946),普林斯顿大学出版社:普林斯顿大学出版社,新泽西州普林斯顿·Zbl 0063.01014号
[19] Day,N.E.,估计正态分布混合的成分,生物特征,56,463-474(1969)·Zbl 0183.48106号
[20] 德玛塔,S。;McNeil,A.J.,《(t)copula和相关copula》,国际统计学家。修订版,73,111-129(2005)·Zbl 1104.62060号
[21] Dharmadhikari,S.W。;Joag-Dev,K.,《单模态、凸性和应用》(1988),学术出版社:马萨诸塞州波士顿学术出版社·Zbl 0646.62008号
[22] Eberlein,E。;Keller,U.,金融中的双曲分布,Bernoulli,1281-299(1995)·Zbl 0836.62107号
[23] 弗雷利,C。;Raftery,A.E.,基于模型的聚类、判别分析和密度估计,J.Amer。统计师。协会,97,611-631(2002)·Zbl 1073.62545号
[24] Franczak,B.C。;Browne,R.P。;McNicholas,P.D.,移位非对称拉普拉斯分布的混合,IEEE Trans。模式分析。机器。智力。,36, 1149-1157 (2014)
[25] 加林贝蒂,G。;Soffriti,G.,《具有非正态误差的多元线性回归:基于混合模型的解决方案》,Statist。计算。,21, 523-536 (2011) ·Zbl 1221.62106号
[26] 加林贝蒂,G。;Soffriti,G.,《使用(t)分布有限混合的多元线性回归分析》,计算。统计师。数据分析。,71, 138-150 (2014) ·Zbl 1471.62070号
[27] Good,I.J.,物种的种群频率和种群参数的估计,Biometrika,40237-264(1953)·Zbl 0051.37103号
[28] Hathaway,R.J.,正态混合分布最大似然估计的约束公式,《统计年鉴》。,13, 795-800 (1985) ·Zbl 0576.62039号
[29] Ho,H.J。;林,T.-I。;Chen,H.-Y。;Wang,W.-L.截断多元分布的一些结果,统计学杂志。计划。推理,142,25-40(2012)·Zbl 1229.62068号
[30] 霍尔兹曼,H。;Munk,A。;Gneiting,T.,椭圆分布有限混合的可识别性,Scand。J.Stat.,33,753-763(2006)·Zbl 1164.62354号
[31] 休伯特,L。;Arabie,P.,比较分区,J.分类,2193-218(1985)
[32] Jörgensen,B.,广义逆高斯分布的统计特性(1982),Springer-Verlag:Springer-Verlag纽约·Zbl 0486.62022号
[33] Karlis,D。;Meligkotsidou,L.,多元泊松分布的有限混合及其应用,J.Statist。计划。推理,1371942-1960(2007)·Zbl 1116.60006号
[34] 科茨,S。;Kozubowski,T.J。;Podgorski,K.,《拉普拉斯分布与推广:应用于通信、经济、工程和金融的重温》(The Laplace Distribution and Generalizations:A Revisit With Applications To Communications,Economics,Engineering,and Finance)(2001),Burkhäuser:Burkháuser Boston·Zbl 0977.62003年
[35] Lee,S.X。;McLachlan,G.J.,《EMMIXuskew:An》R(右)用于通过EM算法J.Statist拟合多元斜(t)分布混合物的软件包。软质。,55, 1-22 (2013)
[36] Lee,S.X。;McLachlan,G.J.,基于模型的聚类和非正态混合分布分类,统计学,方法应用。,22, 427-454 (2013) ·Zbl 1332.62209号
[37] Lee,S.X。;McLachlan,G.J.,多元斜(t)分布的有限混合:一些最新结果,Statist。计算。,24, 181-202 (2014) ·Zbl 1325.62107号
[38] Leroux,B.G.,混合分布的一致估计,Ann.Statist。,20, 1350-1360 (1992) ·Zbl 0763.62015号
[39] Lin,T.-I.,使用多元斜(T)分布的稳健混合建模,统计。计算。,20, 343-356 (2010)
[40] Lin,T.-I.,多元正态混合模型的最大似然估计,多元分析杂志。,100, 257-265 (2009) ·Zbl 1152.62034号
[41] 林,T.-I。;Lee,J.C。;谢伟杰,使用斜(t)分布的稳健混合建模,统计。计算。,17, 81-92 (2007)
[42] 麦克拉克伦,G。;Peel,D.,有限混合模型(2000),Wiley:Wiley纽约·Zbl 0963.62061号
[43] 麦克尼尔,A.J。;弗雷,R。;Embrechts,P.,《定量风险管理:概念、技术和工具》(2005),普林斯顿大学出版社:普林斯顿大学出版,新泽西州普林斯顿·兹比尔1089.91037
[44] McNicholas,P.D.,《基于混合模型的分类》(2016),查普曼和霍尔/CRC出版社:查普曼&霍尔/CRC Press Boca Raton,FL
[45] McNicholas,P.D.,基于模型的聚类,J.Classification,33,331-373(2016)·Zbl 1364.62155号
[46] 麦克尼古拉斯,S.M。;医学博士麦克尼古拉斯。;Browne,R.P.,《方差-γ因子分析的混合物》(Ahmed,S.E.,《大数据和复杂数据分析:方法和应用》(2017),Springer:Springer-Cham),369-385·Zbl 1381.62187号
[47] 医学博士麦克尼古拉斯。;Murphy,T.B.,简约高斯混合模型,统计学。计算。,18285-296(2008年)
[48] 孟,X.-L。;Rubin,D.B.,《通过ECM算法的最大似然估计:一般框架》,《生物特征识别》,80,267-278(1993)·Zbl 0778.62022号
[49] Montanari,A。;Viroli,C.,《学生对大学课程满意度分析的偏态因子模型》,J.Appl。Stat.,43,473-487(2010年)·Zbl 1511.62401号
[50] 莫里斯,K。;McNicholas,P.D.,聚类、分类、判别分析和通过广义双曲混合物降维,计算。统计师。数据分析。,97, 133-150 (2016) ·兹比尔1468.62144
[51] 莫里,P.M。;Browne,R.P。;McNicholas,P.D.,斜交因子分析仪的混合物,计算。统计师。数据分析。,77, 326-335 (2014) ·Zbl 1506.62132号
[52] 派恩,S。;胡,X。;王凯。;Rossin,E。;林,T.-I。;迈尔,L.M。;Baecher-Allan,C。;McLachlan,G.J。;Tamayo,P。;哈夫勒,D.A。;De Jager,P.L。;Mesirow,J.P.,自动化高维流式细胞术数据分析,Proc。国家。阿卡德。科学。,106, 8519-8524 (2009)
[53] Redner,R.A。;Walker,H.F.,《混合密度、最大似然和EM算法》,SIAM Rev.,26195-239(1984)·Zbl 0536.62021号
[54] Sahu,S.K。;戴·D·K。;Branco,M.,一类新的多元偏态分布及其在贝叶斯回归模型中的应用,Canad。J.统计。,31, 129-150 (2003) ·Zbl 1039.62047号
[55] Schwarz,G.,估算模型的维数,Ann.Statist。,6, 461-464 (1978) ·Zbl 0379.62005年
[56] Stephens,M.,《处理混合模型中的标签切换》,J.R.Stat.Soc.Ser。B统计方法。,62, 795-809 (2000) ·Zbl 0957.62020号
[57] Teicher,H.,有限混合的可识别性,《数学年鉴》。统计人员。,34, 1265-1269 (1963) ·Zbl 0137.12704号
[60] Ueda,N。;Nakano,R.,确定性退火em算法,神经网络。,11, 271-282 (1998)
[61] Wang,W.-L。;Lin,T.-I.,多元混合模型的最大似然推断,《多元分析杂志》。,149, 54-64 (2016) ·Zbl 1341.62138号
[65] Yao,W.,非等方差正态混合的剖面似然法,J.Statist。计划。推理,1402089-1998(2010)·Zbl 1184.62029号
[66] Yao,W.,贝叶斯混合标记和聚类,Commun。统计-理论方法,41,403-421(2012)·Zbl 1244.62038号
[67] 姚,W。;Lindsay,B.G.,《最高后验密度贝叶斯混合标记法》,J.Amer。统计师。协会,104758-767(2009)·Zbl 1388.62007号
[68] 周,H。;Lange,K.L.,《在通往主导模式的崎岖道路上》,Scand。J.统计。,37, 612-631 (2010) ·Zbl 1226.62027号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。