×

广义双曲分布的混合。 (英语。法语摘要) Zbl 1320.62144号

摘要:我们引入了广义双曲分布的混合,作为高斯分布及其近亲的普遍混合的替代,其中多元分布和斜分布的混合占主导地位。我们的混合广义双曲分布模型的数学发展依赖于它与广义逆高斯分布的关系。在介绍我们的混合模型以及上述依赖性的详细信息之前,对后者进行了审查。在期望最大化框架中概述了参数估计,然后通过模拟数据和实际数据的应用说明了混合模型的聚类性能。特别是,我们的模型能够从潜在的高斯分布和斜(t)分布中恢复数据的参数。最后,讨论了广义双曲线混合物在更广泛的基于模型的聚类、分类和密度估计文献中的作用。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 艾特肯,《关于伯努利代数方程的数值解》,《爱丁堡皇家学会学报》46页289–(1926)·JFM 52.0098.05号 ·doi:10.1017/S0370164600022070
[2] Andrews,《多元t因子分析仪的扩展混合》,《统计与计算》21(3),第361页–(2011)·Zbl 1255.62171号 ·doi:10.1007/s11222-010-9175-2
[3] Andrews,基于模型的聚类、分类和多元t分布混合判别分析,《统计与计算》22(5),第1021页–(2012)·Zbl 1252.62062号 ·doi:10.1007/s11222-011-9272-x
[4] 安德鲁斯,聚类和分类的变量选择,《分类杂志》31(2),第136页–(2014)·Zbl 1360.62310号 ·doi:10.1007/s00357-013-9139-2
[5] Atienza,有限混合分布可识别性的一个新条件,Metrika 63第215页–(2006)·Zbl 1095.62016号 ·文件编号:10.1007/s00184-005-0013-z
[6] Banfield,基于模型的高斯和非高斯聚类,生物计量学49(3)第803页–(1993)·兹比尔0794.62034 ·doi:10.2307/2532201
[7] Baricz,某些概率密度函数的Turán型不等式,Studia Scientiarum Mathematicarum Hungarica 47 pp 175–(2010)·Zbl 1234.62010年 ·doi:10.1556/SScMath.2009.1123
[8] 巴恩多夫·尼尔森(Barndorff-Nielsen),双曲线上的双曲线分布和分布,《斯堪的纳维亚统计杂志》5,第151页–(1978)·Zbl 0386.60018号
[9] Barndorff-Nielsen,双曲和广义逆高斯分布的无限可除性,Zeitschrift für Wahrscheinlichkeits theorye und Verwandte Gebiete 38 pp 309-(1977)·Zbl 0403.60026号 ·doi:10.1007/BF00533162
[10] Biernacki,用综合完成可能性评估聚类的混合模型,IEEE模式分析和机器智能汇刊22,第719页–(2000)·doi:10.1109/34.865189
[11] Blaesil,P.1978年
[12] Böhning,单参数指数族密度混合物的似然比分布,统计数学研究所年鉴46 pp 373–(1994)·Zbl 0802.62017年 ·doi:10.1007/BF01720593
[13] Browne,混合物:聚类和分类的混合物模型(2013)
[14] Browne,《估计高维中的常见主成分》,《数据分析和分类进展》8(2),第217页–(2014)·doi:10.1007/s11634-013-0139-1
[15] Browne,使用高斯和均匀分布混合的基于模型的学习,IEEE模式分析和机器智能汇刊34(4),第814页–(2012)·doi:10.1109/TPAMI.2011.199
[16] Cabral,使用偏正态独立分布的多元混合建模,计算统计与数据分析56(1),第126页–(2012)·Zbl 1239.62058号 ·doi:10.1016/j.csda.2011.06.026
[17] 坎贝尔(Campbell),《两种薄突石蟹属岩蟹变异的多元研究》,《澳大利亚动物学杂志》22,第417页–(1974)·doi:10.1071/ZO9740417
[18] Celeux,高斯简约聚类模型,模式识别28(5)pp 781–(1995)·Zbl 05480211号 ·doi:10.1016/0031-3203(94)00125-6
[19] 陈,多元正态混合物的推断,多元分析杂志100(7),第1367页–(2009)·兹比尔1162.62052 ·doi:10.1016/j.jmva.2008.12.005
[20] Dasgupta,通过基于模型的聚类检测杂波空间点过程的特征,《美国统计协会杂志》93页294–(1998)·Zbl 0906.62105号 ·数字标识代码:10.1080/01621459.1998.10474110
[21] de Leeuw,一维夏普二次优化,计算统计与数据分析53(7),第2471页–(2009)·Zbl 1453.62078号 ·doi:10.1016/j.csda.2009.01.002
[22] Dean,《使用未标记数据更新分类规则并将其应用于食品真实性研究》,《皇家统计学会杂志》,C 55(1)系列,第1页–(2006)·Zbl 1490.62155号 ·文件编号:10.1111/j.1467-9876.200526.x
[23] Dempster,通过EM算法获得不完整数据的最大似然,皇家统计学会杂志,B系列39(1)第1页–(1977)·Zbl 0364.62022号
[24] 弗雷利,基于模型的聚类、判别分析和密度估计,《美国统计协会杂志》97(458),第611页–(2002)·兹比尔1073.62545 ·doi:10.1198/016214502760047131
[25] Fraley,C.Raftery,A.E.Scrucca,L.2013 mclust:基于模型的聚类、分类和密度估计的正态混合建模
[26] Franczak,移位非对称拉普拉斯分布的混合,IEEE模式分析和机器智能汇刊36(6),第1149页–(2014)·doi:10.1109/TPAMI.2013.216
[27] 很好,物种的种群频率和种群参数的估计,《生物统计学》40 pp 237–(1953)·Zbl 0051.37103号 ·doi:10.1093/biomet/40.3-4.237
[28] Halgreen,广义逆高斯分布和双曲分布的自分解性,Zeitscreft für Wahrscheinlichkeitstheorie und Verwandte Gebiete 47第13页–(1979)·兹比尔0377.60020 ·doi:10.1007/BF00533246
[29] Handcock,社交网络的基于模型的聚类,《皇家统计学会杂志》,A系列170(2),第301页–(2007)·Zbl 05273954号 ·doi:10.1111/j.1467-985X.2007.00471.x
[30] Hastie,高斯混合判别分析,皇家统计学会杂志,B系列58(1),第155页–(1996)·Zbl 0850.62476号
[31] 海瑟薇,正态混合分布最大似然估计的约束公式,《统计学年鉴》13(2),第795页–(1985)·Zbl 0576.62039号 ·doi:10.1214操作系统/1176349557
[32] Holzmann,椭圆分布有限混合的可识别性,《斯堪的纳维亚统计杂志》,33 pp 753–(2006)·Zbl 1164.62354号 ·网址:10.1111/j.1467-9469.2006.00505.x
[33] Hubert,比较分区,分类杂志2(1),第193–(1985)页·Zbl 0587.62128号 ·doi:10.1007/BF01908075
[34] 乔根森,广义逆高斯分布的统计特性(1982)·Zbl 0486.62022号 ·数字对象标识代码:10.1007/978-1-4612-5698-4
[35] Karlis,多元泊松分布的有限混合及其应用,《统计规划与推断杂志》137(6),第1942页–(2007)·Zbl 1116.60006号 ·doi:10.1016/j.jspi.2006.07.001
[36] Kass,Bayes factors,《美国统计协会杂志》90(430),第773页–(1995)·doi:10.1080/01621459.1995.10476572
[37] Kass,嵌套假设的参考贝叶斯检验及其与Schwarz标准的关系,《美国统计协会杂志》90(431)第928页–(1995)·Zbl 0851.62020号 ·doi:10.1080/01621459.1995.10476592
[38] Kent,定向数据有限混合的可识别性,《统计年鉴》第11页,984–(1983)·Zbl 0515.62018号 ·doi:10.1214/aos/1176346264
[39] Kotz,《拉普拉斯分布和推广:通信、经济、工程和金融应用的重新审视》(2001年)·Zbl 0977.62003年 ·doi:10.1007/978-1-4612-0173-1
[40] Lee,《多元斜t分布的有限混合:一些最新结果》,《统计与计算》24(2),第181页–(2014)·Zbl 1325.62107号 ·doi:10.1007/s11222-012-9362-4
[41] Lin,多元正态混合模型的最大似然估计,《多元分析杂志》100页257–(2009)·Zbl 1152.62034号 ·doi:10.1016/j.jmva.2008.04.010
[42] Lin,使用多元斜t分布的稳健混合建模,《统计与计算》20(3)pp 343–(2010)·doi:10.1007/s11222-009-9128-9
[43] Lin,通过节约型t混合模型捕获模式,《统计与概率快报》88页,第80页–(2014年)·Zbl 1369.62131号 ·doi:10.1016/j.spl.2014.01.015
[44] 林赛,NSF-CBMS概率与统计区域会议系列(1995年)
[45] 麦克拉克伦,判别分析和统计模式识别(1992)·Zbl 1108.62317号 ·doi:10.1002/0471725293
[46] 麦克尼尔,《定量风险管理:概念、技术和工具》(2005)·Zbl 1089.91037号
[47] McNicholas,使用潜在高斯混合模型的基于模型的分类,《统计规划与推断杂志》140(5),第1175页–(2010)·Zbl 1181.62095号 ·doi:10.1016/j.jspi.2009.11.006
[48] McNicholas,通过简约高斯混合模型实现基于模型的聚类的串行和并行实现,计算统计与数据分析54(3),第711页–(2010)·Zbl 1464.62131号 ·doi:10.1016/j.csda.2009.02.011
[49] McNicholas,S.M.McNichoras,P.D.Browne,R.P.2014年
[50] Melnykov,《关于有限混合模型的后验概率分布及其在聚类中的应用》,《多元分析杂志》122第175页–(2013)·Zbl 1279.62114号 ·doi:10.1016/j.jmva.2013.07.014
[51] Murray,倾斜t因子分析器的混合物,计算统计学和数据分析77第326页–(2014)·Zbl 1506.62132号 ·doi:10.1016/j.csda.2014.03.012
[52] Murray,常见倾斜t因子分析仪的混合物,Stat 3(1)第68页–(2014)·doi:10.1002/sta4.43
[53] Peel,使用t分布的稳健混合物建模,统计和计算10(4)第339页–(2000)·doi:10.1023/A:1008981510081
[54] Prates,M.O.Cabral,C.B.Lachos,V.H.2013 mixsmsn:拟合斜态正态分布的比例混合的有限混合
[55] R核心团队,R:统计计算的语言和环境(2013)
[56] Raftery,基于模型聚类的变量选择,《美国统计协会期刊》101(473),第168页–(2006)·Zbl 1118.62339号 ·doi:10.19198/0162114506000000113
[57] 兰德,聚类方法评估的客观标准,《美国统计协会杂志》66(336),第846页–(1971)·doi:10.1080/01621459.1971.10482356
[58] Redner,《混合物密度、最大似然和EM算法》,SIAM Review 26 pp 195–(1984)·Zbl 0536.62021号 ·数字对象标识代码:10.1137/1026034
[59] Schwarz,估算模型的维度,《统计年鉴》第6卷第461页–(1978年)·兹伯利0379.62005 ·doi:10.1214/aos/1176344136
[60] 斯蒂芬斯,《处理混合模型中的标签转换》,《皇家统计学会杂志》,B辑62(4),第795页–(2000)·Zbl 0957.62020号 ·doi:10.1111/1467-9868.00265
[61] Venables,《现代应用统计学与S-PLUS》(1999)·doi:10.1007/978-1-4757-3121-7
[62] Vrbik,多元偏态t-混合模型EM算法的分析计算,《统计学与概率快报》82(6),第1169页–(2012)·Zbl 1244.65012号 ·doi:10.1016/j.spl.2012.02.200
[63] Vrbik,基于模型的聚类和分类的简约斜交混合模型,计算统计与数据分析71,第196页–(2014)·Zbl 1471.62202号 ·doi:10.1016/j.csda.2013.07.008
[64] Watson,《贝塞尔函数理论》(1944)·Zbl 0063.08184号
[65] 雅科维茨,《关于有限混合物的可识别性》,《数理统计年鉴》39第209页–(1968)·Zbl 0155.25703号 ·doi:10.1214/aoms/1177698520
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。