×

有限混合、投影追踪和张量秩:三角剖分。 (英语) Zbl 1466.62355号

摘要:多元分布的有限混合在基于模型的聚类中起着重要作用。然而,它们带来了一些问题,尤其是在存在许多无关变量的情况下。通常使用投影寻踪等降维方法来解决这些问题。本文使用偏度最大化投影来恢复最优分离聚类均值的子空间。然后,为了搜索其他可能感兴趣的数据结构或执行对偏度敏感的统计分析,例如Hotelling’s(T^{2})检验,可以删除偏度。我们的方法本质上是代数的,并且处理第三个多元累积量的对称张量秩。我们还导出了几个多元混合模型的第三累积量的对称张量秩的闭式表达式,包括斜正态分布的混合和具有比例协方差矩阵的两个对称分量的混合。本文的理论结果揭示了混合组分估计数与其偏度之间的关系。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62甲12 多元分析中的估计
46号30 泛函分析在概率论和统计学中的应用
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Adcock C、Eling M、Loperfido N(2015)《金融和精算科学中的扭曲分布:综述》。《欧洲财务杂志》21:1253-1281·doi:10.1080/1351847X.2012.720269
[2] Ambagaspitiya RS(1999)关于两类相关总索赔的分布。数学经济保险24:301-308·Zbl 0945.62110号 ·doi:10.1016/S0167-6687(99)00006-2
[3] Arellano-Valle RB,Genton MG,Loschi RH(2009)多元偏态分布的形状混合。多变量分析杂志100:91-101·兹比尔1151.62042 ·doi:10.1016/j.jmva.2008.03.009
[4] Azzalini A,Capitanio A(2003)对称扰动产生的分布,强调多元斜态分布。J R统计Soc B 65:367-389·Zbl 1065.62094号 ·数字对象标识代码:10.1111/1467-9868.00391
[5] Azzalini A,Genton MG(2008)基于偏态t和相关分布的稳健似然方法。国际统计版次76:106-129·Zbl 1206.62102号 ·文件编号:10.1111/j.1751-5823.2007.0016.x
[6] Bartoletti S,Loperfido N(2010)通过偏态正态分布对空气污染数据进行建模。Stoch Environ Res风险评估24:513-517·兹比尔1462.62697 ·doi:10.1007/s00477-009-0341-z
[7] Blough DK(1989)多元对称和不对称。Inst Stat数学24:513-517
[8] Bolton RJ,Krzanowski WJ(2003),探索性数据分析的投影寻踪聚类。J计算图表统计12:121-142·doi:10.1198/1061860031374
[9] Bouveyron C,Brunet-Saumard C(2014),基于模型的高维数据聚类:综述。计算统计数据分析71:52-78·Zbl 1471.62032号 ·doi:10.1016/j.csda.2012.12.008
[10] Branco MD,Dey DK(2001)一类一般的偏椭圆分布。多变量分析杂志79:99-113·兹比尔0992.62047 ·doi:10.1006/jmva.2000.1960
[11] Comon P(2014)《时态:简介》。IEEE Sig工艺磁仪器电子工程31:44-53
[12] Comon P,Golub G,Lim L-H,Mourrain B(2008)对称张量和对称张量秩。SIAM J矩阵分析应用30:1254-1279·Zbl 1181.15014号 ·doi:10.1137/060661569
[13] Fraley C、Raftery Adrian E、Scrucca L(2017)mclust:基于模型的聚类、分类和密度估计的高斯混合建模。https://CRAN.R-project.org/package=mclust。R包5.3版·Zbl 1520.62002号
[14] Franceschini C,Loperfido N(2017a)MaxSkew:基于偏度的投影追踪。https://CRAN.R-project.org/package=MaxSkew。R包版本1.1
[15] Franceschini C,Loperfido N(2017b)MultiSkew:测量、测试和消除多元偏度。https://CRAN.R-project.org/package=MultiSkew。R包版本1.1.1
[16] Friedman J(1987)探索性投影追踪。美国统计协会杂志82:249-266·Zbl 0664.62060号 ·doi:10.1080/01621459.1987.10478427
[17] Friedman JH,Tukey JW(1974)探索性数据分析的投影寻踪算法。IEEE Trans-Comput Ser C 23:881-890·Zbl 0284.68079号 ·doi:10.1109/T-C.1974.224051
[18] Frühwirth-Schnatter S,Pyne S(2010)关于单变量和多元偏正态分布和斜[-t\]-t分布有限混合的贝叶斯推断。生物统计学11:317-336·Zbl 1437.62465号 ·doi:10.1093/biostatistics/kxp062
[19] Grasman RPPP、Huizenga HM、Geurts HM(2010)《多元标准比较中的偏离常态:霍特林T2的克雷默替代方案》。神经心理学48:1510-1516·doi:10.1016/j.neurophychologia.2009.11.016
[20] Hennig C(2004)分类的非对称线性降维。J计算图表统计13:930-945·doi:10.1198/106186004X12740
[21] Hennig,C。;Weihs,C.(编辑);Gaul,W.(编辑),可视化聚类验证方法,153-160(2005),海德堡·doi:10.1007/3-540-28084-7_15
[22] Hui G,Lindsay BG(2010)《通过白噪声矩阵进行投影追踪》。桑克亚B 72:123-153·Zbl 1362.62128号 ·doi:10.1007/s13571-011-0008-x
[23] Jondeau E,Rockinger M(2006),高阶矩下的最优投资组合配置。欧洲财务管理12:29-55·网址:10.1111/j.1354-7798.2006.00309.x
[24] Karlis D,Xekalaki E(2003)为有限混合物的EM算法选择初始值。计算统计数据分析41:577-590·Zbl 1429.62082号 ·doi:10.1016/S0167-9473(02)00177-9
[25] Kim H-M,Mallick BK(2003)具有斜分布的随机向量的矩及其二次型。统计概率快报63:417-423·Zbl 1116.62357号 ·doi:10.1016/S0167-7152(03)00121-4
[26] Landsberg JM,Michalek M(2017)关于矩阵乘法和其他对称张量的边界秩分解几何。SIAM J应用代数几何1:2-19·Zbl 1365.15034号 ·doi:10.1137/16M1067457
[27] Lee S,McLachlan GJ(2013)非正态混合分布的基于模型的聚类和分类。统计方法应用程序22:427-454(含讨论)·Zbl 1332.62209号 ·doi:10.1007/s10260-013-0237-4
[28] Lin XS(2004)复合分布。收录于:精算科学百科全书,第1卷。威利,第314-317页
[29] Lindsay BG,Yao W(2012)Fisher信息矩阵:一种用于降维、投影追踪、独立分量分析等的工具。加拿大J Stat 40:712-730·Zbl 1349.62300号 ·doi:10.1002/cjs.1166
[30] Loperfido,N.,广义偏态正态分布,65-80(2004),博卡拉顿
[31] Loperfido N(2013)偏斜和线性判别函数。统计概率快报83:93-99·Zbl 1489.62183号 ·doi:10.1016/j.spl.2012.08.032
[32] Loperfido N(2014)线性对称变换。多变量分析杂志129:186-192·Zbl 1288.62082号 ·doi:10.1016/j.jmva.2014.04.018
[33] Loperfido N(2015a)基于模型的聚类的向量值偏度。Stat Probab Lett 99:230-237·Zbl 1396.62145号 ·doi:10.1016/j.spl.2015.01.018
[34] Loperfido N(2015b)第三多元矩的奇异值分解。线性代数应用473:202-216·Zbl 1312.15011号 ·doi:10.1016/j.laa.2014.05.043
[35] Loperfido N(2018)基于偏斜的投影追踪:一种计算方法。计算统计数据分析120:42-57·Zbl 1469.62111号 ·doi:10.1016/j.csda.2017.11.001
[36] Loperfido N,Mazur S,Podgorski K(2018)多元总索赔模型的第三累积量。《扫描演员杂志》2018:109-128·兹比尔1398.62315 ·doi:10.1080/03461238.2017.1306795
[37] Mardia K(1970)多元偏度和峰度的测量及其应用。生物特征57:519-530·兹比尔0214.46302 ·doi:10.1093/biomet/57.3.519
[38] McNicholas PD(2016)基于模型的聚类。J类33:331-373·Zbl 1364.62155号 ·doi:10.1007/s00357-016-9211-9
[39] Melnykov V,Maitra R(2010)有限混合模型和基于模型的聚类。统计综述4:80-116·Zbl 1190.62121号 ·doi:10.1214/09-SS053
[40] Miettinen J、Taskinen S、Nordhausen K、Oja H(2015)第四矩和独立成分分析。统计科学3:372-390·Zbl 1332.62196号 ·doi:10.1214/15-STS520
[41] Móri T,Rohatgi V,Székely G(1993)关于多元偏度和峰度。理论问题应用38:547-551·Zbl 0807.60020号 ·doi:10.1137/1138055
[42] Morris K,McNicholas PD,Scrucca L(2013),通过多元t分布的混合物对基于模型的聚类进行降维。高级数据分析类7:321-338·Zbl 1273.62141号 ·doi:10.1007/s11634-013-0137-3
[43] Oeding L,Ottaviani G(2013)张量的特征向量和Waring分解算法。符号计算杂志54:9-35·Zbl 1277.15019号 ·doi:10.1016/j.jsc.2012.1005
[44] Paajarvi P,Leblanc J(2004)盲反褶积中脉冲源的偏斜最大化。在:第六届北欧信号处理研讨会论文集NORSIG,芬兰埃斯波
[45] Peña D,Prieto FJ(2001)使用预测进行聚类识别。美国统计学会杂志96:1433-1445·Zbl 1051.62055号 ·doi:10.1198/016214501753382345
[46] Rao CR,Rao MB(1998)矩阵代数及其在统计学和计量经济学中的应用。新加坡世界科学有限公司·Zbl 0915.15001号 ·doi:10.1142/3599
[47] Sakata T、Sumi T、Miyazaki M(2016)实张量秩的代数和计算方面。东京施普林格·Zbl 1347.13001号 ·数字对象标识代码:10.1007/978-4-431-55459-2
[48] Scrucca L(2010)基于模型聚类的降维。统计计算20:471-484·doi:10.1007/s11222-009-9138-7
[49] Scrucca L(2014)基于模型的混合判别分析的图形工具。高级数据分析类8:147-165·Zbl 1459.62121号 ·doi:10.1007/s11634-013-0147-1
[50] Tarpey T,Yun D,Petkova E(2009)模型错误指定:有限混合还是均匀?统计模型8:199-218·Zbl 07257868号 ·doi:10.1177/1471082X0800800204
[51] Tyler DE,Critchley F,Dümbgen L,Oja H(2009)不变量坐标选择。J R Stat Soc B 71:1-27(含讨论)·Zbl 1250.62032号 ·文件编号:10.1111/j.1467-9868.2009.00706.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。