×

表示基于马氏型距离的多元函数数据聚类方法。 (英语) Zbl 1427.62054号

摘要:本文提出了用(J\ge1)对(L^2(I))^{J}中多元函数样本进行聚类的方法。该方法基于(k)-均值算法,在该算法中,考虑到函数数据所有分量的相关性和可变性,曲线之间的距离用一个度量来测量,该度量推广了Hilbert空间中的马氏距离。该方法已在仿真中进行了研究,并与基于其他距离的平均值进行了比较,这些距离通常用于聚类多元函数数据。在这些模拟中,我们发现具有广义马氏距离的k均值算法在误分类曲线数量的平均值和标准差方面提供了最佳的聚类性能。最后,将该方法应用于心电信号和生长曲线的两个案例研究,验证并加强了仿真结果。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
62H20个 关联度量(相关性、典型相关性等)
62页第10页 统计学在生物学和医学中的应用;元分析
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Boudaoud S,Rix H,Meste O(2010)一组曲线的核心形状建模。计算统计数据分析54:308-325·Zbl 1464.62032号 ·doi:10.1016/j.csda.2009.08.003
[2] Bouveyron C(2015)funFEM:区分功能子空间中的聚类。R软件包版本1.1。https://CRAN.R-project.org/package=funFEM。2018年11月26日访问
[3] Cerioli A(2005)K-means聚类分析和马氏指标:有问题的匹配还是被忽视的机会?统计应用17:1
[4] Ferraty F,Vieu P(2006),非参数函数数据分析:理论与实践。统计学中的斯普林格系列。纽约州施普林格·Zbl 1119.62046号
[5] Galeano P、Joseph E、Lillo Rosa E(2014)功能数据的马氏距离及其分类应用。技术计量57(2):281-291·doi:10.1080/00401706.2014.902774
[6] Gattone SA,Rocci R(2012),简化子空间上的聚类曲线。J计算图统计21(2):361-379·数字对象标识码:10.1080/10618600.2012.679237
[7] Ghiglietti A,Paganoni AM(2017)高斯随机过程均值的精确检验。统计调查快报131:102-107·Zbl 1391.62072号 ·doi:10.1016/j.spl.2017.08.001
[8] Ghiglietti A,Ieva F,Paganoni AM(2017)《随机过程的统计推断:双样本假设检验》。J Stat Plann推断180:49-68·Zbl 1349.62219号 ·doi:10.1016/j.jspi.2016.08.004
[9] Horváth L,Kokoszka P(2012)《函数数据与应用的推断》。统计学中的斯普林格系列。纽约州施普林格·Zbl 1279.62017号 ·doi:10.1007/978-1-4614-3655-3
[10] Ieva F,Paganoni AM,Pigoli D,Vitelli V(2013)心电图曲线形态分析的多变量功能聚类。J R Stat Soc Ser C应用统计62:401-418·文件编号:10.1111/j.1467-9876.2012.01062.x
[11] Jacques J,Preda C(2014),基于模型的多元函数数据聚类。计算统计数据分析71:92-106·Zbl 1471.62096号 ·doi:10.1016/j.csda.2012.12.004
[12] Kaufman L,Rousseeuw PJ(2009)《数据中的发现群体:聚类分析导论》,第344卷。纽约威利·兹比尔1345.62009
[13] Liu X,Müller HG(2003)时间扭曲基因表达谱数据的模式和聚类。生物信息学19:1937-1944·doi:10.1093/bioinformatics/btg257
[14] Liu X,Yang M(2009)功能数据的同步曲线注册和聚类。计算统计数据分析53:1361-1376·Zbl 1452.62993号 ·doi:10.1016/j.csda.2008.11.019
[15] Martino A、Ghiglietti A、Ieva F、Paganoni AM(2018)gmfd:功能数据的推断和聚类。R包版本1.0.1。https://CRAN.R-project.org/package=gmfd。2018年11月26日访问·Zbl 1427.62054号
[16] Melnykov I,Melnykov V(2014)关于使用Mahalanobis距离的K-means算法。统计调查快报84:88-95·Zbl 1284.62383号 ·doi:10.1016/j.spl.2013.09.026
[17] R核心团队(2016)R:统计计算的语言和环境。R统计计算基金会,维也纳
[18] Ramsay J,Silverman BW(2002)应用功能数据分析-方法和案例研究。统计学中的斯普林格系列。纽约州施普林格·Zbl 1011.62002号 ·doi:10.1007/b98886
[19] Ramsay J,Silverman BW(2005),功能数据分析,第2版。统计学中的斯普林格系列。纽约州施普林格·Zbl 1079.62006号 ·doi:10.1007/b98888
[20] Ramsay JO,Wickham H,Graves S,Hooker G(2014)fda:功能数据分析。R包版本2.4.4
[21] Sangalli LM、Secchi P、Vantini S、Vitelli V(2010)《曲线聚类的k-mean对齐》,《计算统计数据分析》54:1219-1233·Zbl 1464.62153号 ·doi:10.1016/j.csda.2009.12.008
[22] Soueidatt M(2014)Funclustering:一个用于功能数据集群的包。R包版本1.0.1。https://CRAN.R-project.org/package=Funclusterning。2018年11月26日访问
[23] Tarpey T,Kinateder KKK(2003),聚类功能数据。J类20:93-114·Zbl 1112.62327号 ·doi:10.1007/s00357-003-0007-3
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。