×

低维子空间中函数数据的聚类。 (英语) Zbl 1254.62077号

摘要:为了在低维数据子空间中找到功能对象的最佳簇,通常使用一种称为串联分析的顺序方法,尽管这种方法存在问题。提出了一种新的方法来寻找函数对象的最优聚类,并同时找到聚类的最优子空间。该方法基于函数数据的(k)-均值准则,寻找数据中聚类结构信息量最大的子空间。描述了一种高效的交替最小二乘算法,并将该方法扩展为正则化方法。人工和实际数据实例分析表明,该方法给出了正确且可解释的结果。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
65C60个 统计中的计算问题(MSC2010)

关键词:

尺寸缩减;平滑的
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abraham C,Cornillon PA,Matzner-Lober E,Molinari N(2003)使用B样条的无监督曲线聚类。Scand J统计30:581–595·Zbl 1039.91067号 ·doi:10.1111/1467-9469.00350
[2] Arabie P,Hubert L(1994)《营销研究中的聚类分析》。收录:Bagozzi RP(eds)高级营销研究方法。剑桥大学布莱克威尔商业学院,第160–189页
[3] Besse PC、Cardot H、Ferraty F(1997),非平衡纵向数据的同步非参数回归。计算统计数据分析24:255–270·Zbl 0900.62199号 ·doi:10.1016/S0167-9473(96)00067-9
[4] Besse PC,Ramsay JO(1986)采样函数的主成分分析。《精神医学杂志》51:285–311·Zbl 0623.62048号 ·doi:10.1007/BF02293986
[5] Boente G,Fraiman R(2000),基于核的功能主成分。统计概率Lett 48:335–345·兹比尔0997.62024 ·doi:10.1016/S0167-7152(00)00014-6
[6] Bouveyron C,Jacques J(2011),基于模型的特定群功能子空间时间序列聚类。高级数据分析分类5:281–300·Zbl 1274.62416号 ·doi:10.1007/s11634-011-0095-6
[7] De Boor C(2001)花键实用指南,修订版。纽约州施普林格·Zbl 0987.65015号
[8] de Leeuw J,Young FW,Takane Y(1976)《定性数据中的加性结构:具有最佳缩放特征的交替最小二乘法》。精神医学41:471–503·Zbl 0351.92031号 ·doi:10.1007/BF02296971
[9] DeSarbo WS、Jedidi K、Cool K、Schendel D(1990)《同时多维展开和聚类分析:战略集团的调查》。马克·莱特2:129–146·doi:10.1007/BF00436033
[10] De Soete G,Carroll JD(1994)低维欧几里得空间中的K-means聚类。收录:Diday E、Lechevallier Y、Schader M、Bertrand P、Burtschy B(eds)分类和数据分析新方法。海德堡施普林格,第212-219页
[11] Dunford N,Schwartz JT(1988)线性算子,谱理论,希尔伯特空间中的自伴算子,第2部分。纽约Interscience·Zbl 0635.47002号
[12] Green PJ,Silverman BW(1994),非参数回归和广义线性模型:粗糙度惩罚方法。查普曼和霍尔,伦敦·Zbl 0832.62032号
[13] Hardy A(1996)关于集群的数量。计算统计数据分析23:83–96·Zbl 0900.92186号 ·doi:10.1016/S0167-9473(96)00022-9
[14] Hartigan J(1975)聚类算法。威利,纽约·Zbl 0372.62040号
[15] Hubert L,Arabie P(1985)比较分区。J类2:193–218·Zbl 0587.62128号 ·doi:10.1007/BF01908075
[16] Kneip A(1994)类似曲线数据常见回归变量的非参数估计。Ann Stat 22:1386–1427年·Zbl 0817.62029号 ·doi:10.1214/aos/1176325634
[17] Illian JB、Prosser JI、Baker KL、Rangel-Castro JI(2009)《功能主成分数据分析:分析微生物群落指纹的新方法》。微生物方法杂志79:89–95·doi:10.1016/j.meter.2009年8月10日
[18] Lloyd SP(1982)PCM中的最小二乘量化。IEEE Trans-Inf理论28:128–137·Zbl 0504.94015号
[19] Milligan GW,Cooper MC(1985)《确定数据集中簇数的程序检查》。《心理测量学》50:159–179·doi:10.1007/BF02294245
[20] Ocaña FA,Aguilera AM,Valderrama MJ(1982)通过选择范数进行函数主成分分析。多变量分析杂志71:262–276·Zbl 0944.62059号 ·doi:10.1006/jmva.1999.1844
[21] Pezzulli SD,Silverman BW(1993),功能数据平滑主成分分析的一些性质。计算统计8:1–16·Zbl 0775.62146号
[22] R开发核心团队(2005)R:统计计算的语言和环境。R统计计算基金会。奥地利。ISBN 3-900051-07-0,URL网址:http://www.R-project.org
[23] Ramsay JO,Wang X,Flanagan R(1995)人类手指捏合力的功能数据分析。罗伊统计学会系列C 44:17-30·Zbl 0821.62085号
[24] Ramsay JO,Silverman BW(2005),功能数据分析,第二版。纽约州施普林格
[25] Rice JA,Silverman BW(1991),当数据为曲线时,非参数估计均值和协方差结构。J Roy Stat Soc Ser B 53:233–243号·Zbl 0800.62214号
[26] Rossi F,Conan-Guez B,Golli AE(2004)用SOM算法聚类功能数据。ESANN’2004年会议记录,第305–312页
[27] Silverman BW(1996)通过选择范数平滑函数主成分分析。安统计24:1–24·Zbl 0853.62044号 ·doi:10.1214操作系统/1033066196
[28] Steinley D(2003)K-意思是集群:你不知道的可能会伤害你。心理方法8:294–304·doi:10.1037/1082-989X.8.3.294
[29] Steinley D,Henson R(2005)OCLUS:生成已知重叠簇的分析方法。J类22:221–250·Zbl 1336.62191号 ·doi:10.1007/s00357-005-0015-6
[30] Suyundykov R,Puechmorel S,Ferre L(2010)Sobolev空间中使用小波的PCA多元函数数据聚类。超链接文章:inria-00494702
[31] Tarpey T(2007)《线性变换和k-means聚类算法:聚类曲线的应用》。美国统计局61:34–40·Zbl 05680714号 ·doi:10.1198/000313007X171016
[32] Timmerman ME、Ceulemans E、Kiers HAL、Vichi M(2010)重新考虑了因子分解和减少的K-means。计算统计数据分析54:1858–1871·Zbl 1284.62396号 ·doi:10.1016/j.csda.2010.02.009
[33] Vichi M,Kiers HAL(2001),双向数据的因子k均值分析。计算统计数据分析37:49–64·Zbl 1051.62056号 ·doi:10.1016/S0167-9473(00)00064-5
[34] Wahba G(1990)观测数据的样条模型。费城工业和应用数学学会·Zbl 0813.62001号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。