×

用于聚类多元函数数据的联合潜在因子分析器和函数子空间模型。 (英语) Zbl 1495.62053号

摘要:我们介绍了一种基于模型的方法来聚类多元函数数据观测。我们利用关于截断Karhunen-Loeve展开式上代理密度的理论结果以及函数空间的直接和规范来定义函数主成分上的矩阵正态分布。该公式允许分别以子空间投影和潜在因素分析器的形式对多元函数观测的单变量分量的函数空间和系数空间进行单独的简约建模。该方法有助于在全多元水平和组件水平上进行解释,当组件函数具有明确的含义时,这一点尤为重要。我们推导了一种用于拟合模型的AECM算法,并讨论了适当的初始化策略、收敛性和模型选择准则。我们通过对具有多个功能组件的观测数据进行仿真和两次数据分析,证明了该模型的适用性。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62H25个 因子分析和主成分;对应分析
62M99型 随机过程推断
62兰特 功能数据分析
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 比尔纳基,C。;Celeux,G。;Govaert,G.,《用综合完全似然评估聚类的混合模型》,IEEE Trans。模式分析。机器。智力。,22, 7, 719-725 (2000) ·doi:10.1109/34.865189
[2] Biernacki,C.,Celeux,G.,Govaert,G.:为em算法选择起始值,以获得多元高斯混合模型中的最大似然。计算。统计数据分析。41(3), 561-575 (2003). doi:10.1016/S0167-9473(02)00163-9,https://www.sciencedirect.com/science/article/pii/S0167947302001639混合模型的最新发展·Zbl 1429.62235号
[3] Bongiorno,E。;Goia,A.,关于hilbert随机元的小球概率分解的一些见解,Stat.Sin。,1949年至1965年(2017年)·Zbl 1392.60008号 ·doi:10.5705/ss.202016.0128
[4] Bongiorno,E.G.,Goia,A.:基于替代密度的希尔伯特数据分类方法。计算。Stati公司。数据分析。99, 204-222 (2016). doi:10.1016/j.csda.2016.01.019。https://www.sciencedirect.com/science/article/pii/S0167947316300056 ·Zbl 1468.62030号
[5] Bouveyron,C。;Jacques,J.,《特定群体功能子空间中基于模型的时间序列聚类》,《高级数据分析》。分类。,5, 281-300 (2011) ·Zbl 1274.62416号 ·doi:10.1007/s11634-011-0095-6
[6] Bouveyron,C。;Girard,S。;Schmid,C.,高维数据聚类,计算。统计数据分析。,52, 1, 502-519 (2007) ·Zbl 1452.62433号 ·doi:10.1016/j.csda.2007.02.009
[7] Cardot,H。;费拉蒂,F。;Sarda,P.,函数线性模型,统计概率。莱特。,45, 11-22 (1999) ·兹比尔0962.62081 ·doi:10.1016/S0167-7152(99)00036-X
[8] Cardot,H.,Ferraty,F.,Sarda,P.:函数线性模型的样条估计。Stat.罪。13(3):571-591, (2003) . http://www.jstor.org/stable/24307112 ·Zbl 1050.62041号
[9] 陈,D。;霍尔,P。;Müller,HG,带非参数链接的单指数和多指数函数回归模型,《统计年鉴》,39,3,1720-1747(2011)·Zbl 1220.62040号 ·doi:10.1214/11-AOS882
[10] Chiou,J.M.,Li,P.L.:功能聚类和识别纵向数据的子结构。J.R.统计社会服务。B(Stat.Methodol.)69(4),679-699(2007)。doi:10.1111/j.1467-9868.2007.00605.x·Zbl 07555371号
[11] Dauxois,J.,Pousse,A.,Romain,Y.:向量随机函数主成分分析的渐近理论:统计推断的一些应用。J.多变量。分析。12(1), 136-154 (1982). doi:10.1016/0047-259X(82)90088-4。https://www.sciencedirect.com/science/article/pii/0047259X82900884 ·Zbl 0539.62064号
[12] Dawid,A.P.:一些矩阵变量分布理论:符号考虑和贝叶斯应用。《生物特征》68(1),265-274(1981)。doi:10.1093/biomet/68.1.265。https://academic.oup.com/biomet/article-pdf/68/1/265/652522/68-1-265.pdf ·Zbl 0464.62039号
[13] Delaigle,A。;Hall,P.,《定义随机函数分布的概率密度》,《Ann.Stat.》,38,2,1171-1193(2010)·兹比尔1183.62061 ·doi:10.1214/09-AOS741
[14] Dempster,A.P.,Laird,N.M.,Rubin,D.B.:通过em算法获得不完整数据的最大似然。J.R.统计社会服务。B(Methodol.)39(1),1-22(1977)。doi:10.1111/j.2517-6161.1977.tb01600.x.doi:10.1 111/j0.2517-6161.1977.tb01600.x·Zbl 0364.62022号
[15] Fremdt,S.,Steinbach,J.G.,Horvath,L.,Kokoszka,P.:测试函数样本中协方差算子的相等性。扫描。《J Stat.40》(1),138-152(2013)。doi:10.1111/j.1467-9469.2012.00796.x·Zbl 1259.62031号
[16] 格兰仕,H。;Carvalho,L.,矩阵正态分布的期望最大化算法,J.Multivar。分析。(2013) ·Zbl 1395.62123号 ·doi:10.1016/j.jmva.2018.03.010
[17] Hall,P.,Keilegom,IV.:从离散数据开始的功能数据分析中的双样本测试。Stat.罪。17(4):1511-1531 (2007). http://www.jstor.org/stable/24307686 ·Zbl 1136.62035号
[18] 兴,T。;Eubank,R.,《函数数据分析的理论基础与线性算子导论》(2015),西苏塞克斯:威利·Zbl 1338.62009号 ·doi:10.1002/9781118762547
[19] 休伯特,L。;Arabie,P.,比较分区,J.Classif。,2, 193-218 (1985) ·doi:10.1007/BF01908075
[20] Ieva,F.,Paganoni,A.M.,Pigoli,D.,Vitelli,V.:心电图曲线形态分析的多变量功能聚类。J.R.统计社会服务。C(应用统计)62(3),401-418(2013)。doi:10.1111/j.1467-9876.2012.01062.x
[21] Jacques,J.,Preda,C.:Funclust:使用函数随机变量密度近似的曲线聚类方法。神经计算112:164-171(2013)。doi:10.1016/j.neucom.2012.11.042。https://www.sciencedirect.com/science/article/pii/S0925231213002233人工神经网络、机器学习和计算智能的进展
[22] Jacques,J.,Preda,C.:功能数据聚类:一项调查。高级数据分析。分类。8(3), 24 (2014). doi:10.1007/s11634-013-0158-y。https://hal.inia.fr/hal-00771030 ·Zbl 1414.62018年
[23] Jacques,J.,Preda,C.:多元函数数据的基于模型的聚类。计算。统计数据分析。71, 92-106 (2014). doi:10.1016/j.csda.2012.12.004。https://www.sciencedirect.com/science/article/pii/S0167947312004380 ·Zbl 1471.62096号
[24] 詹姆斯,总经理;Sugar,CA,稀疏采样函数数据的聚类,J.Am.Stat.Assoc.,98462397-408(2003)·兹比尔1041.62052 ·doi:10.1198/016214503000189
[25] 卡亚诺,M。;Dozono,K。;Konishi,S.,通过正交归一化高斯基展开的函数聚类分析及其应用,J.Classif。,27, 2, 211-230 (2010) ·Zbl 1337.62134号 ·doi:10.1007/s00357-010-9054-8
[26] Keribin,C.:混合模型阶数的一致估计。Sankhyá:印度J.Stat.Ser。A(1961-2002)62(1):49-66(2000)。http://www.jstor.org/stable/25051289 ·Zbl 1081.62516号
[27] 林,Z。;穆勒,HG;Yao,F.,混合物内积空间及其在功能数据分析中的应用,《Ann.Stat.》,46,1,370-400(2018)·Zbl 1393.62029号 ·doi:10.1214/17-AOS1553
[28] 马蒂诺,A。;Ghiglietti,A。;伊娃·F。;Paganoni,A.,基于马氏型距离的聚类多元函数数据的k-means程序,Stat.Methods Appl。(2017) ·Zbl 1427.62054号 ·doi:10.1007/s10260-018-00446-6
[29] Meng,X.L.,Rubin,D.B.:通过ECM算法的最大似然估计:一般框架。生物特征80(2),267-278(1993)。doi:10.1093/biomet/80.2.267。https://academy.oup.com/biomet/article-pdf/80/2/267/698085/80-267.pdf ·Zbl 0778.62022号
[30] Meng,X.L.,Van Dyk,D.:em算法——一首古老的民歌,以快速的新曲调演唱。J.R.统计社会服务。B(Stat.Methodol.)59(3),511-567(1997)。doi:10.1111/1467-9868.00082。数字对象标识代码:10.1111/1467-9868.00082·兹比尔1090.62518
[31] Mercer,J.:正负型函数及其与积分方程理论的联系。菲洛斯。事务处理。R.Soc.伦敦。序列号。A、 包含。巴普。数学。物理学。性格。209:415-446, (1909). http://www.jstor.org/stable/91043 ·JFM 40.0408.02号文件
[32] Nathan A(2008)《投手f/x投球棒球轨迹分析》
[33] 乔,X。;郭,S。;James,GM,功能图形模型,J.Am.Stat.Assoc.,114,525,211-222(2019)·Zbl 1478.62123号 ·doi:10.1080/01621459.2017.1390466
[34] Ramsay,J.,Silverman,B.:功能数据分析。《斯普林格统计丛书》,纽约斯普林格出版社(2005年)。https://books.google.ca/books?id=REzuyz_V6OQC ·Zbl 1079.62006号
[35] 拉姆齐,乔;胡克,G。;Graves,S.,《用R和MATLAB进行函数数据分析》(2009),公司:施普林格出版公司·Zbl 1179.62006号 ·doi:10.1007/978-0-387-98185-7
[36] Rice,J.A.,Silverman,B.W.:当数据为曲线时,非参数估计平均值和协方差结构。J.R.统计社会服务。B(方法学)53(1),233-243(1991)。doi:10.1111/j.2517-6161.1991.tb01821.x.doi:10.1 111/j0.2517-6161.1991.tb0182 1.x·Zbl 0800.62214号
[37] Rousseeuw,P.J.:轮廓:用于解释和验证聚类分析的图形辅助工具。J.计算。申请。数学。20, 53-65 (1987). doi:10.1016/0377-0427(87)90125-7。https://www.sciencedirect.com/science/article/pii/0377042787901257 ·Zbl 0636.62059号
[38] Sangalli,L.M.、Secchi,P.、Vantini,S.、Vitelli,V.:曲线聚类的k-均值对齐。计算。《统计数据分析》54(5),1219-1233(2010)。doi:10.1016/j.csda.2009.12.008。https://www.sciencedirect.com/science/article/pii/S016794730900465 ·Zbl 1464.62153号
[39] 萨波尔塔,G.:《探索的方法》(Méthodes exploration to res d’analysis de données tempelles)。巴黎第六大学皮埃尔和玛丽·居里大学论文集(1981年)。https://tel.archives-ouvertes.fr/tel-00711814
[40] Schmutz,A。;雅克·J。;Bouveyron,C。;Cheze,L。;Martin,P.,在特定群函数子空间中聚类多元函数数据,计算。统计(2020年)·Zbl 1505.62360号 ·doi:10.1007/s00180-020-00958-4
[41] Schwarz,G.:估算模型的维数。Ann.Stat.6(2):461-464(1978)。http://www.jstor.org/stable/2958889 ·兹伯利0379.62005
[42] 夏普,A。;Browne,R.,通过投影到潜在广义双曲子空间的函数数据聚类,高级数据分析。分类。(2021) ·Zbl 07433036号 ·doi:10.1007/s11634-020-00432-5
[43] Silverman,BW,通过选择范数进行平滑函数主成分分析,《Ann.Stat.》,24,1,1-24(1996)·Zbl 0853.62044号 ·doi:10.1214/aos/1033066196
[44] Singhal,A。;Seborg,D.,聚类多元时间序列数据,J.Chemom。,19, 427-438 (2005) ·doi:10.1002/厘米945
[45] 斯里瓦斯塔瓦,M。;冯·罗森,T。;von Rosen,D.,《克罗内克产品协方差结构模型:估计和测试》,数学。方法统计,17,357-370(2008)·Zbl 1231.62101号 ·doi:10.3103/S1066530708040066
[46] Steele,R.,Raftery,A.:高斯混合模型的贝叶斯模型选择标准的性能1。前面。统计折旧。贝叶斯分析。(2010)
[47] 德士吉,S。;Yadohisa,H。;Inada,K.,《多元函数数据的Crisp和模糊K-means聚类算法》,计算。统计,22,1-16(2007)·Zbl 1196.62089号 ·doi:10.1007/s00180-006-0013-0
[48] Vohra,K.,Vodonos,A.,Schwartz,J.,Marais,E.A.,Sulprizio,M.P.,Mickley,L.J.:化石燃料燃烧产生的室外细颗粒污染导致的全球死亡率:来自地球化学的结果。环境。第195号决议、第110754号决议(2021年)。doi:10.1016/j.envres.2021.110754。https://www.sciencedirect.com/science/article/pii/S0013935121000487
[49] 王,JL;Chiou,JM;穆勒,HG,功能数据分析,Ann.Rev.Stat.Appl。,3, 1, 257-295 (2016) ·doi:10.1146/annurev-statistics-041715-033624
[50] Wang,L.:Karhunen-Loeve展开及其应用。博士论文(2008)
[51] Zambom,A.Z.,Collazos,J.A.A.,Dias,R.:通过假设检验k-means进行功能数据聚类。计算。《美国联邦法律大全》第34卷第527-549页(2019年)。doi:10.1007/s00180-018-0808-9·Zbl 1417.62181号
[52] Zhang,J.T.,Liang,X.,Xiao,S.:关于函数数据的双样本behrens-fisher问题。J.统计理论实践。(2011). doi:10.1080/15598608.2010.10412005·Zbl 1420.62362号
[53] Zhu,H.,Strawn,N.,Dunson,DB:多元函数数据的贝叶斯图形模型。J.马赫。学习。第17(204)号决议:1-27(2016)。http://jmlr.org/papers/v17/16-164.html ·Zbl 1436.62722号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。