×

泛函(k)-均值聚类算法的一种新的带导数信息的距离。 (英语) Zbl 1440.62249号

摘要:functional\(k\)-means聚类算法是一种广泛使用的函数数据聚类方法。然而,使用该算法,在计算两个函数样本之间的相似度时,不会进一步考虑导数信息。事实上,导数信息对于捕捉函数数据之间的趋势特征差异非常重要。本文定义了一种新的距离,通过添加函数样本的导数信息来度量函数样本之间的相似性。此外,在理论上,我们构造了聚类质心,该质心可以最小化基于所提出距离的泛函(k)均值聚类算法的目标函数。在使用三种常见的基表示技术对函数数据进行预处理后,我们比较了基于四种不同相似性度量的函数均值聚类算法的聚类性能。在六个带有类标签的数据集上的实验表明,在统计上定义了距离的函数(k)均值聚类算法的有效性和鲁棒性。此外,在三个实际数据集上的实验结果验证了定义距离的泛函(k)均值聚类算法的收敛性和实用性。

MSC公司:

62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 亚伯拉罕,C。;Cornillon,P.A。;Matzner-Löber,E。;Molinari,N.,《使用b样条的无监督曲线聚类》,Scand。《统计杂志》,30,581-595(2003)·Zbl 1039.91067号
[2] Ando,T.,多维功能数据分类的惩罚最优评分,Stat.Methodol。,6, 565-576 (2009)
[3] Bai,L。;Cheng,X。;梁,J。;沈,H。;Yike,G.,基于(k)均值算法的快速密度聚类策略,模式识别。,71, 375-386 (2017)
[4] Bandyopadhyay,S。;Maulik,U.,《基于(k)均值算法的进化技术在rn中的最优聚类》,Inf.Sci。,146, 221-237 (2002) ·Zbl 1033.68595号
[5] Boulé,M.,通过分段常数非参数密度估计进行函数数据聚类,模式识别。,45, 4389-4401 (2012) ·Zbl 1248.68398号
[6] Bouveyron,C。;Brunet-Saumard,C.,《基于模型的高维数据聚类:综述》,《计算》。统计数据分析。,71, 52-78 (2014) ·Zbl 1471.62032号
[7] Bouveyron,C。;Jacques,J.,《特定群功能子空间中基于模型的时间序列聚类》,《高级数据分析》。分类。,5, 281-300 (2011) ·Zbl 1274.62416号
[8] 曹,F。;梁,J。;Jiang,G.,使用邻域模型的(k)-均值算法的初始化方法,计算。数学。申请。,58, 474-483 (2009) ·兹比尔1189.68095
[9] Chan,K.P。;Fu,A.W.C.,小波有效时间序列匹配,数据工程,论文集。,第十五届国际会议,126-133(1999),IEEE
[10] Y.Chen,E.Keogh,B.Hu,N.Begum,A.Bagnall,A.Mueen,G.Batista,《ucr时间序列分类档案》,网址:www.cs.ucr.edu/eamon/time_series_data;Y.Chen,E.Keogh,B.Hu,N.Begum,A.Bagnall,A.Mueen,G.Batista,美国加州大学时间序列分类档案,网址www.cs.ucr.edu/eamon/time_series_data
[11] 陈,Y。;张,L。;Yi,Z.,使用低秩约束自动编码器的子空间聚类,Inf.Sci。,424, 27-38 (2018) ·Zbl 1436.68319号
[12] Chiou,J.M。;Müller,H.G.,通过残差过程进行函数回归诊断,计算机。统计数据分析。,51, 4849-4863 (2007) ·Zbl 1162.62394号
[13] Chow,Y.S。;Teicher,H.,《概率论:独立性、互换性,鞅》(2012),施普林格科学与商业媒体·Zbl 0399.60001号
[14] 科菲,N。;辛德,J。;Holian,E.,使用p-样条和混合效应模型对时间进程基因表达数据的纵向轮廓进行聚类,计算。统计数据分析。,第71页,第14-29页(2014年)·Zbl 1471.62045号
[15] D’urso,P.,《多元时变数据的模糊c-均值聚类模型:不同方法》,《国际不确定性模糊知识》。基于系统。,12, 287-326 (2004) ·Zbl 1046.62061号
[16] D’Urso,P.,具有内点和外点时间轨迹的数据时间阵列的模糊聚类,IEEE Trans。模糊系统。,13, 583-604 (2005)
[17] 法卢索斯,C。;兰加纳坦,M。;Manolopoulos,Y.,《时间序列数据库中的快速子序列匹配》,Proc。1994年ACM SIGMOD国际数据管理会议,419-429(1994)
[18] Favero,R.E。;King,R.W.,《语音识别的小波参数化:平移和尺度参数的变化》,语音、图像处理和神经网络,1994年。ISSIPNN’94会议记录,国际研讨会,694-697(1994),IEEE
[19] 费拉蒂,F。;Vieu,P.,《非参数函数数据分析:理论与实践》(2006),Springer Science&Business Media·Zbl 1119.62046号
[20] 字体,C.H。;Budman,H.,多元时间序列的混合聚类方法——应用于燃气轮机故障分析的案例研究,ISA Trans。,71, 513-529 (2017)
[21] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,《统计学习的要素》,第1卷,《统计学中的斯普林格系列》(2001),斯普林格:斯普林格柏林·Zbl 0973.62007号
[22] 加马赛,R。;Zarandi,M.,挖掘功能数据中动态模式的新dirichlet过程,Inf.Sci。,405, 55-80 (2017) ·Zbl 1429.68216号
[23] 洛杉矶加西亚-埃斯库德罗。;Gordaliza,A.,鲁棒曲线聚类的建议,J.Classif。,22, 185-201 (2005) ·Zbl 1336.62179号
[24] Giacofci,M。;Lambert-Lacroix,S。;马洛特,G。;Picard,F.,《基于小波的高维混合效应功能模型聚类》,《生物统计学》,69,31-40(2013)·Zbl 1274.62774号
[25] Hand,D.J。;Till,R.J.,多类别分类问题roc曲线下面积的简单概括,马赫。学习。,45171年-186年(2001年)·Zbl 1007.68180号
[26] 哈斯蒂,T。;Buja,A。;Tibshirani,R.,《惩罚判别分析》,《Ann.Stat.》,23,73-102(1995)·Zbl 0821.62031号
[27] 黄,X。;Ye,Y。;熊,L。;Lau,R.Y。;蒋,N。;Wang,S.,时间序列(k)-means:一种新的时间序列数据的(k)-means:类型光滑子空间聚类,Inf.Sci。,367, 1-13 (2016) ·Zbl 1428.62276号
[28] 雅克,J。;Preda,C.,《功能数据聚类:调查》,《高级数据分析》。分类。,8231-255(2014年)·Zbl 1414.62018年
[29] 卡亚诺,M。;Dozono,K。;Konishi,S.,通过正交归一化高斯基展开的函数聚类分析及其应用,J.Classif。,27, 211-230 (2010) ·Zbl 1337.62134号
[30] 刘,Y。;美国艾克林。;Feyereisl,J。;Durrant,L.G.,用于检测结直肠癌数据中生物标记物的小波特征提取和遗传算法,Knowl。基于系统。,37, 502-514 (2013)
[31] López,M。;马丁内斯,J。;马蒂亚斯,J.M。;Taboada,J。;维兰,J.A.,《使用机器学习技术对装饰石材进行功能分类》,J.Compute。申请。数学。,234, 1338-1345 (2010) ·Zbl 1209.68468号
[32] Luan,Y。;Li,H.,使用带b样条的混合效应模型对时间进程基因表达数据进行聚类,生物信息学,19474-482(2003)
[33] Maulik,美国。;Bandyopadhyay,S.,一些聚类算法和有效性指标的性能评估,IEEE Trans。模式分析。机器。智力。,24, 1650-1654 (2002)
[34] Meng,Y。;梁,J。;钱,Y.,分类中功能数据正交表示的比较研究,Knowl。基于系统。,97224-236(2016)
[35] 莫里斯,J.S。;Carroll,R.J.,基于小波的函数混合模型,J.R.Stat.Soc.,68,179-199(2006)·Zbl 1110.62053号
[36] 穆尼奥斯,A。;González,J.,使用支持向量机表示函数数据,模式识别。莱特。,31, 511-516 (2010)
[37] Park,J。;Ahn,J.,带相位变化的多变量功能数据聚类,生物统计学,73,324-333(2017)·Zbl 1366.62238号
[38] 彭杰。;Müller,H.G.,稀疏观测随机过程的基于距离的聚类,及其在在线拍卖中的应用,Ann.Appl。《法律总汇》第2卷,1056-1077页(2008年)·Zbl 1149.62053号
[39] Preda,C。;萨波尔塔,G。;Lévéder,C.,Pls功能数据分类,计算。统计,22,223-235(2007)·Zbl 1196.62086号
[40] Ramsay,J。;Silverman,B.,《功能数据分析》,斯普林格统计系列(2005),斯普林格:斯普林格纽约·Zbl 1079.62006号
[41] 塞族,N。;Wasserman,L.,《猫:转换和平滑后的聚类》,《美国统计协会期刊》,100990-999(2005)·Zbl 1117.62422号
[42] Tarpey,T。;Kinateder,K.K.,聚类功能数据,J.分类,2093-114(2003)·Zbl 1112.62327号
[43] 德士吉,S。;Yadohisa,H。;Inada,K.,Crisp和fuzzy——多元函数数据的聚类算法,计算。统计,22,1-16(2007)·Zbl 1196.62089号
[44] 王,D。;Shi,L。;Yeung,D.S。;曾荫权(Tsang,E.C.)。;Heng,P.A.,用于功能磁共振成像分析的椭球支持向量聚类,模式识别。,40, 2685-2695 (2007) ·Zbl 1132.68606号
[45] Wang,J。;黄,K。;Wang,H.,功能数据分析的聚类方法,应用。统计管理。,28, 839-844 (2009)
[46] Wang,J.L。;Chiou,J.M。;Müller,H.G.,《功能数据分析》,年。修订状态申请。,3, 257-295 (2016)
[47] 周,J。;Chen,M.,半函数线性模型的样条估计,统计概率。莱特。,82, 505-513 (2012) ·兹比尔1237.62051
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。