×

矩阵正态分布的对偶子空间简约混合。 (英语) Zbl 07739775号

摘要:我们提出了一种矩阵正态分布混合的简约对子空间聚类方法。通过假设行协方差矩阵和列协方差矩阵的某些主成分同等重要,我们在不牺牲判别信息的情况下用较少的参数表示模型。我们推导了ECM算法的更新规则,并提出了确保可识别性的必要条件。我们使用仿真来演示参数恢复,并通过两个数据分析来说明模型的简约性和竞争性。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 艾特金,M。;Rubin,DB,有限混合模型中的估计和假设检验,J R Stat Soc Ser B(Methodol),47,1,67-75(1985)·Zbl 0576.62038号
[2] 班菲尔德,J。;Raftery,A.,基于模型的高斯和非高斯聚类,生物统计学,49,803-821(1993)·Zbl 0794.62034号 ·doi:10.2307/2532201
[3] 肯塔基州巴斯福德;McLachlan,GJ,用于三向数据的混合聚类方法,J Classify,12558(1985)·doi:10.1007/BF01908066
[4] Bellman,R.,《动态规划理论》,美国数学学会,60,6,503-515(1954)·Zbl 0057.1253号 ·doi:10.1090/S0002-9904-1954-09848-8
[5] 比尔纳基,C。;Celeux,G。;Govaert,G.,为em算法选择初始值以获得多元高斯混合模型中的最大似然,计算统计数据分析,41,3,561-575(2003)·Zbl 1429.62235号 ·doi:10.1016/S0167-9473(02)00163-9
[6] Bouveyron,C。;Brunet-Saumard,C.,《基于模型的高维数据聚类:综述》,《计算统计数据分析》,71,52-78(2014)·Zbl 1471.62032号 ·doi:10.1016/j.csda.2012.12.008
[7] Bouveyron,C。;Girard,S。;Schmid,C.,《高维数据聚类》,《计算统计数据分析》,52,1,502-519(2007)·Zbl 1452.62433号 ·doi:10.1016/j.csda.2007.02.009
[8] Bouveyron C、Celeux G、Murphy TB、Raftery AE(2019)《基于模型的数据科学聚类和分类:在R.Cambridge统计和概率数学系列中的应用》。剑桥大学出版社。国际标准图书编号9781108494205。https://books.google.ca/books?id=ldGoDwAAQBAJ ·Zbl 1436.62006年
[9] Browne,RP;Mcnicholas,PD,《高维常见主成分估算》,《高级数据分析分类》,8,2,217-226(2014)·兹比尔1474.62183 ·doi:10.1007/s11634-013-0139-1
[10] Celeux,G。;Govaert,G.,高斯简约聚类模型,模式识别,28,5,781-793(1995)·doi:10.1016/0031-3203(94)00125-6
[11] Dawid,AP,《一些矩阵变量分布理论:符号考虑和贝叶斯应用》,《生物统计学》,68,1,265-274(1981)·Zbl 0464.62039号 ·doi:10.1093/生物技术/68.1265
[12] 美联社登普斯特;新墨西哥州莱尔德;Rubin,DB,通过em算法从不完整数据中获得最大似然,J R Stat Soc Ser B(Methodol),39,1,1-22(1977)·Zbl 0364.62022号 ·doi:10.1111/j.2517-6161.1977.tb01600.x
[13] 多格鲁,FZ;布卢特,YM;Arslan,O.,矩阵变量t分布的有限混合,Gazi Univ J Sci,29,335-341(2016)
[14] Dua D,Graff C(2017)UCI机器学习库。http://archive.ics.uci.edu/ml
[15] 杜达,R。;Hart,P.,《模式分类和场景分析》(1973),伦敦:威利出版社,伦敦·Zbl 0277.68056号
[16] 弗雷利,C。;Raftery,AE,多少簇?哪种聚类方法?通过基于模型的聚类分析得出的答案,The Comput J,41,8,578-588(1998)·Zbl 0920.68038号 ·doi:10.1093/comjnl/41.8.578
[17] 弗雷利,C。;Raftery,A.,基于模型的聚类、判别分析和密度估计,美国统计协会,97611-631(2002)·Zbl 1073.62545号 ·doi:10.1198/016214502760047131
[18] 弗雷利,C。;Raftery,A.,增强的基于模型的聚类、密度估计和判别分析软件:Mclust,J Classif,20,263-286(2003)·Zbl 1055.62071号 ·doi:10.1007/s00357-003-0015-3
[19] 弗雷利,C。;Raftery,A.,增强的基于模型的聚类、密度估计和判别分析软件:Mclust,J Class,20,263-286(2003)·Zbl 1055.62071号 ·doi:10.1007/s00357-003-0015-3
[20] Gallaugher Michael,PB;McNicholas,P.,偏斜矩阵变量分布的有限混合,模式识别,80,83-93(2018)·doi:10.1016/j.patcog.2018.02.025
[21] 加洛赫,M。;McNicholas,P.,倾斜矩阵变量双线性因子分析仪的混合物,高级数据分析类,14,11(2019)·Zbl 1474.62227号 ·doi:10.1007/s11634-019-00377-4
[22] Ghahramani Z,Hinton GE(1996)混合因子分析仪的em算法
[23] 格兰仕,H。;Carvalho,L.,矩阵正态分布的期望最大化算法,《多元分析杂志》,167,09(2013)·Zbl 1395.62123号 ·doi:10.1016/j.jmva.2018.03.010
[24] 休伯特,L。;Arabie,P.,《比较分区》,J Classify,2193-218(1985)·Zbl 0587.62128号 ·doi:10.1007/BF01908075
[25] Keribin,C.,混合模型阶数的一致估计,印度统计期刊A,62,1,49-66(2000)·Zbl 1081.62516号
[26] 麦克拉克伦,G。;Peel,D.,有限混合模型(2000),伦敦:威利,伦敦·Zbl 0963.62061号 ·doi:10.1002/0471721182
[27] GJ麦克拉克伦;皮,D。;Bean,RW,通过混合因子分析仪建模高维数据,《计算统计数据分析》,41,3,379-388(2003)·Zbl 1256.62036号 ·doi:10.1016/S0167-9473(02)00183-4
[28] McNicholas,PD,基于模型的聚类,J Classify,33,331-373(2016)·Zbl 1364.62155号 ·doi:10.1007/s00357-016-9211-9
[29] McNicholas,P。;Murphy,T.,简约高斯混合模型,统计计算,18,285-296(2008)·doi:10.1007/s11222-008-9056-0
[30] 梅利尼科夫,V。;Zhu,X.,《基于模型的偏斜矩阵数据聚类》,《多元分析杂志》,167,04(2018)·Zbl 1395.62165号 ·doi:10.1016/j.jmva.2018.04.007
[31] 梅利尼科夫,V。;Zhu,X.,《2000-2012年美国犯罪趋势研究》,《高级数据分析类》,2013年6月(2018年)·Zbl 1459.62220号 ·doi:10.1007/s11634-018-0326-1
[32] 孟,X-L;Rubin,DB,《通过ecm算法进行最大似然估计:一般框架》,Biometrika,80,2,267-278(1993)·Zbl 0778.62022号 ·doi:10.1093/biomet/80.2.267
[33] R核心团队(2020)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳。https://www.R-project.org/
[34] 罗德,K。;Wasserman,L.,使用混合正态分布的实用贝叶斯密度估计,美国统计协会杂志,92,439,894-902(1997)·Zbl 0889.62021号 ·doi:10.1080/0162145.1997.10474044
[35] Sarkar,S。;朱,X。;梅利尼科夫,V。;Ingrassia,S.,关于矩阵数据建模的简约模型,Comput Stat data Anal,142(2019)·Zbl 1507.62152号 ·doi:10.1016/j.csda.2019.106822
[36] Schwarz,G.,估算模型的维数,Ann Stat,6,2,461-464(1978)·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[37] Scott D,Thompson J(1983),高维概率密度估计。摘自:《计算机科学与统计:第十五届界面研讨会论文集》,第01页
[38] 斯利瓦斯塔瓦,M。;冯·罗森,T。;von Rosen,D.,《具有kronecker乘积协方差结构的模型:估计和测试》,《数学方法统计》,第17期,第357-370页(2008年)·Zbl 1231.62101号 ·doi:10.3103/S1066530708040066
[39] 托马齐奥,S。;Punzo,A。;Bagnato,L.,两种新的矩阵变量分布及其在基于模型的聚类中的应用,《计算统计数据分析》,152(2020)·Zbl 1510.62235号 ·doi:10.1016/j.csda.2020.107050
[40] 托马齐奥,S。;McNicholas,P。;Punzo,A.,矩阵正态聚类加权模型,J Classify(2021)·Zbl 07473950号 ·doi:10.1007/s00357-021-09389-2
[41] Viroli,C.,用于分类三向数据的矩阵正态分布有限混合,《统计计算》,21,511-522(2011)·Zbl 1221.62083号 ·doi:10.1007/s11222-010-9188-x
[42] Viroli,C.,基于模型的三向数据结构聚类,贝叶斯分析,6,4,573-602(2011)·Zbl 1330.62262号 ·doi:10.1214/11-BA622
[43] Wolfe JH(1964)类型最大似然分析的计算机程序。收录:技术公告65-15,美国海军人员研究活动
[44] Xiao H,Rasul K,Vollgraf R(2017)Fashion-mnist:一种用于基准机器学习算法的新型图像数据集
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。