×

功能数据的多尺度聚类。 (英语) Zbl 1436.62271号

摘要:在一个海量复杂数据的时代,聚类是理解和分析非结构化多元数据的最重要程序之一。然而,经典方法(如K均值和层次聚类)在对高维且具有内在多尺度结构的数据进行分组时并不有效。本文提出了一种新的聚类方法,能够适应数据的多尺度特性和高维性。提出的方法基于多分辨率分析和功能数据分析的新组合。作为该方法的核心,使用多分辨率分析概念的聚类方法可以同时反映数据的全球趋势和局部活动,而函数数据分析可以有效地处理高维数据。进一步讨论了实现所提方法的实用算法。通过数值研究(包括模拟研究和实际数据分析)对所提方法的实证性能进行了评估,结果表明所提聚类具有良好的效果。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
42立方厘米 涉及小波和其他特殊系统的非三角谐波分析
62兰特 功能数据分析
62兰特 大数据和数据科学的统计方面

软件:

预防卒中
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] 安东尼亚迪斯,A。;布罗萨特,X。;库利亚里,J。;Poggi,Jm,《使用小波对函数数据进行聚类》,《国际小波、多分辨率和信息处理杂志》,第11期,第1135003页(2013年)·Zbl 1271.62131号 ·doi:10.1142/S0219691313500033
[2] Chiou,Jm;Li,Pl,纵向数据的功能聚类和识别子结构,英国皇家统计学会期刊B辑,69,679-699(2007)·Zbl 07555371号 ·文件编号:10.1111/j.1467-9868.2007.00605.x
[3] Floriello,D。;维泰利,V.,《功能数据的稀疏聚类》,《多元分析杂志》,154,1-18(2017)·Zbl 1353.62069号 ·doi:10.1016/j.jmva.2016.10.008
[4] Giacofci,M.(Giacofci,M.)。;Lambert-Lacroix,S。;马洛特,G。;Picard,F.,《基于小波的高维混合效应功能模型聚类》,《生物统计学》,69,31-40(2013)·Zbl 1274.62774号 ·doi:10.1111/j.1541-0420.2012.01828.x
[5] Hansen,J.、Ruedy,R.、Sato,M.、Lo,K.(2010年)。全球表面温度变化。《地球物理学评论》,48,RG4004,10.1029/2010RG000345。
[6] 黄,奈;Shen,Ssp,Hilbert-Huang变换及其应用(2005),新加坡:世界科学,新加坡·Zbl 1087.62500号 ·doi:10.1142/5862
[7] 黄,奈;沈,Z。;长,Sr;吴,麦克;Shih,Hh先生;郑琦。;Yen,Nc;Tung,抄送;Liu,Hh,非线性和非平稳时间序列分析的经验模式分解和希尔伯特谱,伦敦皇家学会学报A,454903-995(1998)·兹比尔0945.62093 ·doi:10.1098/rspa.1998.0193
[8] 休伯特,L。;Arabie,P.,比较分区,分类杂志,2193-218(1985)·doi:10.1007/BF01908075
[9] 詹姆斯,Gm;糖,钙,稀疏采样功能数据的聚类,美国统计协会杂志,98,397-408(2003)·Zbl 1041.62052号 ·doi:10.1198/016214503000189
[10] Jaques,J。;Preda,C.,《功能数据聚类:调查》,《数据分析和分类进展》,第8231-255页(2013年)·Zbl 1414.62018年 ·doi:10.1007/s11634-013-0158-y
[11] Lee,Tcm,通过组合不同平滑度的估计值改进平滑样条回归,《统计学与概率快报》,67,133-140(2004)·Zbl 1058.62035号 ·doi:10.1016/j.spl.2004.01.003
[12] Mallat,S.,《信号处理的小波之旅》(2009),纽约:学术出版社,纽约·Zbl 1170.94003号
[13] 莫里斯,Js;Carroll,Rj,基于小波的函数混合模型,英国皇家统计学会杂志,B辑,68179-199(2006)·Zbl 1110.62053号 ·文件编号:10.1111/j.1467-9868.2006.00539.x
[14] Rand,Wm,聚类方法评估的客观标准,美国统计协会杂志,66846-850(1971)·doi:10.1080/01621459.1971.10482356
[15] Ray,S。;Mallick,B.,《贝叶斯小波方法的函数聚类》,《皇家统计学会杂志》,B辑,68,305-332(2006)·Zbl 1100.62058号 ·文件编号:10.1111/j.1467-9868.2006.00545.x
[16] Tibshirani,R。;Walther,G。;Hastie,T.,通过缺口统计估算数据集中的簇数,《皇家统计学会期刊》,B辑,63,411-423(2001)·Zbl 0979.62046号 ·doi:10.111/1467-9868.00293
[17] Wand,Mp,回归样条曲线平滑程序的比较,计算统计学,15,443-462(2000)·兹比尔1037.62038 ·doi:10.1007/s00180000047
[18] 韦克菲尔德,J。;周,C。;Self,S.,《基因表达随时间变化的建模:具有信息先验分布的曲线聚类》,贝叶斯统计,7721-732(2003)
[19] Witten,博士;Tibshirani,R.,《聚类中特征选择的框架》,《美国统计协会杂志》,105,713-726(2010)·Zbl 1392.62194号 ·doi:10.1198/jasa.2010.tm09415
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。