×

基于分段常数非参数密度估计的函数数据聚类。 (英语) Zbl 1248.68398号

小结:在本文中,我们提出了一种基于分段常数密度估计的分析和总结曲线集合的新方法。将曲线划分为簇,并将曲线点的尺寸离散为区间。这些单变量分区的叉积形成了单元格的数据网格,表示曲线和点维度的联合密度的非参数估计。使用贝叶斯模型选择方法选择最佳模型,并使用组合优化算法进行检索。该方法不需要设置参数,也不需要对曲线进行假设;除了功能数据之外,它还可以应用于分布式数据。在两个真实数据集上介绍了函数数据和分布数据探索性分析方法的实用价值。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别

软件:

fda(右)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] D.Bosq,《函数空间中的线性过程:理论与应用》(统计学讲义),Springer,2000年。;D.Bosq,《函数空间中的线性过程:理论与应用》(统计学讲义),施普林格出版社,2000年·Zbl 0962.60004号
[2] Ramsay,J。;Silverman,B.,《应用功能数据分析:方法和案例研究》(2002),Springer-Verlag Inc·Zbl 1011.62002号
[3] Ramsay,J。;Silverman,B.,《函数数据分析》,《统计学中的Springer系列》(2005),Springer·Zbl 1079.62006号
[4] Tarpey,T。;Kinateder,K.,聚类功能数据,分类杂志,2093-114(2003)·Zbl 1112.62327号
[5] 彭杰。;Müller,H.,稀疏观测随机过程的基于距离的聚类,及其在在线拍卖中的应用,应用统计学年鉴,2,3,1056-1077(2008)·Zbl 1149.62053号
[6] 桑加利。;塞奇,P。;Vantini,S。;Vitelli,V.,曲线聚类的K-mean alignment,计算统计学和数据分析,54,5,1219-1233(2010)·Zbl 1464.62153号
[7] 阿格拉瓦尔,R。;Faloutsos,C。;Swami,A.,序列数据库中的高效相似性搜索,(Lomet,D.,第四届国际数据组织和算法基础会议(FODO)会议记录(1993),Springer Verlag:Springer Verlag Chicago,IL),69-84
[8] 陈锦华,傅安良,小波有效时间序列匹配,载:ICDE,1999,第126-133页。;陈锦华,傅安良,小波有效时间序列匹配,载:ICDE,1999年,第126-133页。
[9] Chamroukhi,F。;Samé,A。;戈瓦特,G。;Aknin,P.,功能数据描述的隐藏过程回归模型。曲线识别的应用,神经计算,73,7-9,1210-1221(2010)
[10] 哈斯蒂,T。;Tibshirani,R。;Friedman,J.,《统计学习的要素》(2001),斯普林格出版社·Zbl 0973.62007号
[11] Deboor,C.,《样条实用指南》(2001),Springer·Zbl 0987.65015号
[12] 亚伯拉罕,C。;Cornillon,P。;Matzner-Lober,E。;Molinari,N.,使用b样条的无监督曲线聚类,斯堪的纳维亚统计杂志,30,3,581-595(2003)·Zbl 1039.91067号
[13] Smyth,P.,《带有隐藏马尔可夫模型的聚类序列》,(Mozer,M.;Jordan,M.,Petsche,T.,《神经信息处理系统的进展》,第9卷(1997),麻省理工出版社),648-654
[14] P.Smyth,基于概率模型的多元和序列数据聚类,摘自:《人工智能与统计学报》,1999年,第299-304页。;P.Smyth,基于概率模型的多元和序列数据聚类,载于《人工智能与统计学报》,1999年,第299-304页。
[15] F.Rossi,B.Conan-Guez,A.E.Golli,用SOM算法聚类函数数据,收录于:《ESANN学报》,2004年,第305-312页。;F.Rossi,B.Conan-Guez,A.E.Golli,用SOM算法聚类函数数据,收录于:《ESANN学报》,2004年,第305-312页。
[16] Hébrail,G。;Hugueney,B。;Lechevallier,Y。;Rossi,F.,通过聚类和最优分割对功能数据进行探索性分析,神经计算/EEG神经计算,73,7-9,1125-1141(2010)
[17] 费拉蒂,F。;Vieu,P.,《非参数函数数据分析:理论与实践》(2006),Springer Verlag·Zbl 1119.62046号
[18] 克兰贝斯,C。;Delsol,L.公司。;Laksaci,A.,功能数据的稳健非参数估计,非参数统计杂志,20,7,573-598(2008)·兹比尔1147.62045
[19] Gasser,T。;霍尔,P。;Presnell,B.,随机曲线分布模式的非参数估计,《皇家统计学会杂志》,60,681-691(1998)·兹比尔0909.62030
[20] Delaigle,G。;Hall,P.,《定义随机函数分布的概率密度》,《统计年鉴》,38,2,1171-1193(2010)·Zbl 1183.62061号
[21] Liao,T.W.,时间序列数据的聚类——一项调查,模式识别,381857-1874(2005)·Zbl 1077.68803号
[22] Boulé,M.,《监督学习中准备和建模的数据网格模型》(2011),缩微出版,第99-130页
[23] Tikhonov,A。;Arsenin,V.,《病态问题的解决》(1977),John Wiley&Sons·Zbl 0354.65028号
[24] Ramsay,J.,非参数项目特征曲线估计的核平滑方法,《心理测量学》,56,4,611-630(1991)·Zbl 0850.62357号
[25] Devroye,L。;Györfi,L。;Lugosi,G.,模式识别的概率理论(1996),Springer·Zbl 0853.68150号
[26] U.Fayyad,G.Piatetsky-Shapiro,P.Smyth,《知识发现和数据挖掘:走向统一框架》,KDD,1996年,第82-88页。;U.Fayyad,G.Piatetsky-Shapiro,P.Smyth,《知识发现和数据挖掘:走向统一框架》,KDD,1996年,第82-88页。
[27] M.Boulé,监督和非监督学习的多元数据网格模型,技术报告,NSM/R&D/TECH/EASY/TSI/5/MB,法国电信研发http://perso.rd.francetelecom.fr/boulle/publications/BouleNTTSI5MB08.pdf\(\范围\);M.Boulé,监督和非监督学习的多元数据网格模型,技术报告,NSM/R&D/TECH/EASY/TSI/5/MB,法国电信研发http://perso.rd.francetelecom.fr/boulle/publications/BouleNTTSI5MB08.pdf\(\等级\)
[28] P.Chapman,J.Clinton,R.Kerber,T.Khabaza,T.Reinartz,C.Shearer,R.Wirth,CRISP-DM 1.0:逐步数据挖掘指南,2000年。;P.Chapman、J.Clinton、R.Kerber、T.Khabaza、T.Reinartz、C.Shearer、R.Wirth、CRISP-DM 1.0:逐步数据挖掘指南,2000年。
[29] M.Boulé,Recherche d'une représentation des données effectace pour la fouille des grandes bases de donnees,博士论文,国家高等教育通信学院http://perso.rd.francetelecom.fr/boulle/publications/BouleThesis07.pdf\(\范围\);M.Boulé,Recherche d'une représentation des données effectace pour la fouille des grandes bases de donnees,博士论文,国家高等教育通信学院http://perso.rd.francetelecom.fr/boulle/publications/BouleThesis07.pdf\(\等级\)
[30] 阿布拉莫维茨,M。;Stegun,I.,《数学函数手册》(1970),多佛出版公司:纽约多佛出版有限公司
[31] C.Shannon,《通信的数学理论》,技术报告27,贝尔系统技术期刊,1948年。;C.香农,通信数学理论,技术报告27,贝尔系统技术期刊,1948年·兹比尔1154.94303
[32] Rissanen,J.,《最短数据描述建模》,Automatica,1465-471(1978)·Zbl 0418.93079号
[33] 盖子,T。;Thomas,J.,《信息理论的要素》(1991),Wiley-Interscience:Wiley-Interscience,美国纽约州纽约市·Zbl 0762.94001号
[34] M.Boulé,监督学习的双变量数据网格模型,技术报告,NSM/R&D/TECH/EASY/TSI/4/MB,法国电信研发http://perso.rd.francetelecom.fr/boulle/publications/BouleNTTSI4MB08.pdf\(\范围\);M.Boulé,监督学习的双变量数据网格模型,技术报告,NSM/R&D/TECH/EASY/TSI/4/MB,法国电信研发http://perso.rd.francetelecom.fr/boulle/publications/BouleNTTSI4MB08.pdf\(\等级\)
[35] Hansen,P。;Mladenovic,N.,《可变邻域搜索:原理和应用》,《欧洲运筹学杂志》,130,449-467(2001)·Zbl 0981.90063号
[36] M.Boulé,《功能数据聚类的无参数方法》,技术报告,法国电信研发部,编号:FT/RD/TECH/11/01/76,2011年。;M.Boulé,《功能数据聚类的无参数方法》,技术报告,法国电信研发部,编号:FT/RD/TECH/11/01/762011。
[37] 弗拉帕特,F。;Calmant,S。;考霍佩,M。;Seyler,F。;Cazenave,A.,亚马逊流域Envisat RA-2-衍生水位验证的初步结果,环境遥感,100,2,252-264(2006)
[38] Y.Lecun,L.Bottou,Y.Bengio,P.Haffner,基于梯度的学习应用于文档识别,收录于:IEEE会议录,1998年第86卷,第2278-2324页。;Y.Lecun,L.Bottou,Y.Bengio,P.Haffner,基于梯度的学习应用于文档识别,收录于:IEEE会议记录,第86卷,1998年,第2278-2324页。
[39] Erhan,D。;科尔维尔,A。;Y.本吉奥。;文森特,P。;Bengio,S.,为什么无监督的预培训有助于深度学习?,机器学习研究杂志,11,625-660(2010)·Zbl 1242.68219号
[40] 沙佩尔,O。;Schölkopf,B。;Zien,A.,《半监督学习》(2006),麻省理工学院出版社:麻省理学院出版社剑桥
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。