×

功能数据聚类:一项调查。 (英语) Zbl 1414.62018年

总结:回顾了功能数据的聚类技术。提出了四组功能数据聚类算法。第一组包括直接处理曲线评估点的方法。第二组由滤波方法定义,该方法首先将曲线近似为函数的有限基,然后使用基展开系数进行聚类。第三组由同时执行曲线降维和聚类的方法组成,从而根据聚类实现数据的功能表示。最后一组是基于距离的方法,使用基于功能数据特定距离的聚类算法。本文介绍了软件综述以及这些算法在实际数据中的应用示例。

MSC公司:

62-07 数据分析(统计)(MSC2010)
62M99型 随机过程的推论
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 哈尔

参考文献:

[1] Abraham C,Cornillon PA,Matzner-Löber E,Molinari N(2003)使用B样条的无监督曲线聚类。扫描统计理论应用30(3):581-595。doi:10.1111/1467-9469.00350·Zbl 1039.91067号
[2] Akaike H(1974)统计模型识别的新视角。IEEE Trans Autom Control 19:716-723(系统识别和时间序列分析)·Zbl 0314.62039号
[3] Antoniadis A,Beder JH(1989)巴拿赫值高斯向量的均值和协方差的联合估计。统计学20(1):77-93·Zbl 0684.62065号 ·网址:10.1080/02331888908802145
[4] Banfield J,Raftery A(1993)基于模型的高斯和非高斯聚类。生物计量学49:803-821·兹比尔0794.62034 ·doi:10.2307/2532201
[5] BergéL,Bouveyron C,Girard S(2012)HDclassif:一个用于高维数据的基于模型的聚类和判别分析的R包。J Stat Softw统计软件42(6):1-29
[6] Besse P(1979)《描述性练习曲》(Etude descriptive d'un processus)。图卢兹保罗·萨巴蒂尔大学的博士学位
[7] Biernacki C,Celeux G,Govaert G(2000)使用综合完全似然评估聚类的混合模型。IEEE Trans-Pattern Ana Mach Intell 22(4):719-725·doi:10.1109/34.865189
[8] Bosq D(2000)《函数空间中的线性过程》,《统计学讲义》,第149卷。纽约施普林格(理论与应用)·Zbl 0962.60004号
[9] BouléM(2012)通过分段常数非参数密度估计进行功能数据聚类。图案识别45(12):4389-4401·Zbl 1248.68398号 ·doi:10.1016/j.patcog.2012.05.016
[10] Boumaza R(1980)《贡献描述》,《功能定性》。法国图卢兹保罗·萨巴蒂尔大学博士论文
[11] Bouveyron C,Brunet C(2013)《基于模型的高维数据聚类:综述》。技术报告·Zbl 1471.62032号
[12] Bouveyron C,Jacques J(2011),基于模型的特定群功能子空间时间序列聚类。高级数据分析等级5(4):281-300·Zbl 1274.62416号 ·doi:10.1007/s11634-011-0095-6
[13] Bouveyron C,Girard S,Schmid C(2007)高维数据聚类。计算统计数据分析52:502-519·Zbl 1452.62433号
[14] Cardot H,Ferraty F,Sarda P(1999)函数线性模型。统计概率快报45:11-22·Zbl 0962.62081号 ·doi:10.1016/S0167-7152(99)00036-X
[15] Cattell R(1966)因子数量的筛选试验。多变量Behav Res 1(2):245-276·doi:10.1207/s15327906mbr0102_10
[16] Celeux G,Govaert G(1995)高斯简约聚类模型。J模式识别Soc 28:781-793·doi:10.1016/0031-3203(94)00125-6
[17] Chiou JM,Li PL(2007)纵向数据的功能聚类和识别子结构。J R Stat Soc系列B Stat Methodol 69(4):679-699。文件编号:10.1111/j.1467-9868.2007.00605.x·兹伯利07555371 ·文件编号:10.1111/j.1467-9868.2007.00605.x
[18] Coifman R,Wickerhauser M(1992)基于熵的最佳基选择算法。IEEE Trans-Inf理论38(2):713-718·Zbl 0849.94005号 ·数字对象标识代码:10.1109/18.119732
[19] Cox T,Cox M(2001)多维标度。查普曼和霍尔,纽约·Zbl 1004.91067号
[20] Cuesta-Albertos J,Fraiman R(2000),功能数据的公正修剪k均值。计算统计数据分析51:4864-4877·Zbl 1162.62377号 ·doi:10.1016/j.csda.2006.07.011
[21] Dauxois J,Pousse A,Romain Y(1982)向量随机函数主成分分析的渐近理论:统计推断的一些应用。多变量分析杂志12(1):136-154。doi:10.1016/0047-259X(82)90088-4·Zbl 0539.62064号 ·doi:10.1016/0047-259X(82)90088-4
[22] Delaigle A,Hall P(2010)定义随机函数分布的概率密度。安统计38:1171-1193·Zbl 1183.62061号 ·doi:10.1214/09-AOS741
[23] Deville J(1974)《Méthodes statistiques et numériques de l’analyse harmonque》。《意大利年鉴》15:3-101
[24] Escabias M,Aguilera A,Valderrama M(2005)通过函数主成分逻辑回归建模环境数据。环境计量16:95-107·doi:10.1002/env.696
[25] Ferraty F,Vieu P(2006)非参数函数数据分析,统计学中的Springer系列。纽约州施普林格·Zbl 1119.62046号
[26] Gaffney S(2004)概率曲线对齐聚类和混合模型预测。美国加州大学欧文分校计算机科学系博士论文
[27] Giacofci M,Lambert-Lacroix S,Marot G,Picard F(2012)基于小波的高维混合效应函数模型聚类。生物计量学(出版中)·Zbl 1274.62774号
[28] Guyon I,Von Luxburg U,Williamson R(2009)《聚类:科学还是艺术》,摘自:NIPS 2009年聚类理论研讨会
[29] Hartigan J,Wong M(1978)《1326算法:k均值聚类算法》。应用统计28:10-108·Zbl 0447.62062号 ·doi:10.307/2346830
[30] Heard N,Holmes C,Stephens D(2006)《疟蚊免疫反应相关基因调控的定量研究:贝叶斯层次聚类曲线的应用》。美国国家统计协会杂志101(473):18-29。doi:10.1198/01621450050000187·兹比尔1118.62368 ·doi:10.1198/01621450050000187
[31] Hébrail G,Hugueney B,Lechevallier Y,Rossi F(2010)通过聚类和最佳分割对功能数据进行探索性分析。神经计算机脑电图神经计算机73(7-9):1125-1141·doi:10.1016/j.neucom.2009.11.022
[32] Ieva F,Paganoni A,Pigoli D,Vitelli V(2012)心电图曲线形态分析的多变量功能聚类。J R Stat Soc Ser C Appl Stat(出版中)
[33] Jacques J,Preda C(2013a)Funclust:使用函数随机变量密度近似的曲线聚类方法。神经计算。doi:10.1016/j.neucom.2012.11.042
[34] Jacques J,Preda C(2013b),基于模型的多元功能数据聚类。计算统计数据分析。doi:10.1016/j.csda.2012.12.004·Zbl 1471.62096号
[35] James G,Sugar C(2003),稀疏采样函数数据的聚类。美国统计协会杂志98(462):397-408·Zbl 1041.62052号 ·doi:10.1198/016214503000189
[36] Karhunen K(1947),《Wahrscheinlichkeitsrechnung的U.ber lineare Methoden》。Ann Acad Sci Fennicae Ser A I数学原理1947(37):79·Zbl 0030.16502号
[37] Kayano M,Dozono K,Konishi S(2010),通过正交归一化高斯基展开的函数聚类分析及其应用。J类27:211-230·Zbl 1337.62134号 ·doi:10.1007/s00357-010-9054-8
[38] Kohonen T(1995)自组织地图。纽约州施普林格·doi:10.1007/978-3-642-97610-0
[39] Lévéder C、Abraham P、Cornillon E、Matzner-Lober E、Molinari N(2004)《政治歧视》。收录:Chimiométrie 2004,巴黎,第37-43页
[40] Liu X,Yang M(2009)功能数据的同步曲线注册和聚类。计算统计数据分析53:1361-1376·Zbl 1452.62993号 ·doi:10.1016/j.csda.2008.11.019
[41] Loève M(1945)《二级功能》。巴黎科学研究院,邮编:220:469·兹比尔0063.03612
[42] MATLAB(2010)7.10.0版(R2010a)马萨诸塞州纳蒂克市MathWorks公司·兹比尔1200.93001
[43] McLachlan G,Peel D(2000)有限混合模型。概率统计威利级数。《应用概率与统计》,Wiley-Interscience,纽约。doi:10.1002/0471721182·Zbl 0963.62061号
[44] Olszewski R(2001)时间序列数据中结构模式识别的广义特征提取。宾夕法尼亚州匹兹堡卡内基梅隆大学博士论文
[45] Peng J,Müller HG(2008)稀疏观测随机过程的基于距离的聚类,及其在在线拍卖中的应用。Ann Appl Stat 2(3):1056-1077。doi:10.1214/08-AOAS172·Zbl 1149.62053号 ·doi:10.1214/08-AOAS172
[46] Preda C,Saporta G,Lévéder C(2007),PLS功能数据分类。计算统计22(2):223-235·Zbl 1196.62086号 ·doi:10.1007/s00180-007-0041-4
[47] R核心团队(2012)R:统计计算的语言和环境。R统计计算基金会,奥地利维也纳。http://www.R-project.org/。国际标准图书编号:3-900051-07-0
[48] Ramsay JO,Silverman BW(2002)应用功能数据分析。统计学中的斯普林格系列。纽约施普林格(方法和案例研究)·Zbl 1011.62002号
[49] Ramsay JO,Silverman BW(2005),功能数据分析,第2版。统计学中的斯普林格系列。纽约州施普林格·Zbl 1079.62006号
[50] Ray S,Mallick B(2006)贝叶斯小波方法的函数聚类。J R Stat Soc Ser B Stat Methodol杂志68(2):305-332。文件编号:10.1111/j.1467-9868.2006.00545.x·Zbl 1100.62058号 ·文件编号:10.1111/j.1467-9868.2006.00545.x
[51] Romano E,Giraldo R,Mateu J(2011)功能数据分析和相关主题的最新进展,Springer,chap聚类空间相关功能数据
[52] Rossi F,Conan-Guez B,El Golli A(2004)用som算法聚类函数数据。摘自:ESANN 2004年会议记录。比利时布鲁日,第305-312页
[53] Saito N,Coifman R(1995)局部判别基及其应用。数学成像杂志5(4):337-358·Zbl 0863.94004号 ·doi:10.1007/BF01250288
[54] SaméA,Chamroukhi F,Govaert G,Aknin P(2011)基于模型的随制度变化的时间序列聚类和分割。高级数据分析类5(4):301-322·兹比尔1274.62427 ·doi:10.1007/s11634-011-0096-5
[55] Sangalli L、Secchi P、Vantini S、Vitelli V(2010a)功能聚类和对齐方法及其应用。通用应用程序工业数学1(1):205-224·Zbl 1329.62289号
[56] Sangalli L,Secchi P,Vantini S,Vitelli V(2010b)\[k\]k-mean alignment for curve clustering.计算统计数据分析54(5):1219-1233·Zbl 1464.62153号 ·doi:10.1016/j.csda.2009.12.008
[57] Saporta G(1981)《探索并分析颞下颌关节》。BURO咖啡馆37-38
[58] Schwarz G(1978)估算模型的维数。Ann Stat 6(2):461-464·Zbl 0379.62005年 ·doi:10.1214/aos/1176344136
[59] Secchi P、Vantini S、Vitelli V(2011)功能数据分析和相关主题的最新进展,Springer,功能数据的空间聚类
[60] Serban N,Jiang H(2012)多层次功能聚类分析。生物统计学68(3):805-814·Zbl 1272.62085号 ·doi:10.1111/j.1541-0420.2011.01714.x
[61] Slaets L、Claeskens G、Hubert M(2012),基于相位和振幅的功能数据聚类。计算统计数据分析56(7):2360-2374·Zbl 1252.62066号 ·doi:10.1016/j.csda.2012.01.017
[62] Sugar C,James G(2003)《发现数据集中的簇数:信息理论方法》。美国统计协会杂志98(463):750-763·Zbl 1046.62064号
[63] Tarpey T,Kinateder K(2003)《聚类功能数据》。J类20(1):93-114·Zbl 1112.62327号 ·doi:10.1007/s00357-003-0007-3
[64] Tipping ME,Bishop C(1999)《主成分分析仪的混合物》。神经计算11(2):443-482·doi:10.1162/0899766999300016728
[65] Tokushige S、Yadohisa H、Inada K(2007)多元函数数据的Crisp和模糊K-means聚类算法。计算统计22:1-16·兹比尔1196.62089 ·doi:10.1007/s00180-006-0013-0
[66] Tuddenham R,Snyder M(1954),加州男孩和女孩从出生到18岁的身体发育。加州大学公共儿童发展1:188-364
[67] Wahba G(1990)观测数据的样条模型。费城SIAM·Zbl 0813.62001号 ·doi:10.1137/1.9781611970128
[68] Ward J,Joe H(1963)优化目标函数的分层分组。美国统计协会杂志58:236-244·doi:10.1080/01621459.1963.10500845
[69] Yamamoto M(2012)低维子空间中函数数据的聚类。高级数据分析类6:219-247·Zbl 1254.62077号 ·doi:10.1007/s11634-012-0113-3
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。