×

基于距离的时间序列分类综述。 (英语) Zbl 1458.62191号

摘要:时间序列分类是一个日益增长的研究课题,因为在广泛的领域中创建了大量的时间序列数据。数据的特殊性使其成为一项具有挑战性的任务,并采取了不同的方法,包括基于距离的方法。1-NN由于其简单但仍然具有良好的性能,已成为基于距离的时间序列分类中广泛使用的方法。然而,其优越性可能归因于能够在分类过程中为时间序列使用特定距离,而不是分类器本身。为了在更复杂的分类器中利用这些距离,在过去几年中出现了一些新的方法,这些方法具有竞争力或优于基于1-NN的方法。在某些情况下,这些新方法使用距离度量将序列转换为特征向量,弥补了时间序列和传统分类器之间的差距。在其他情况下,距离用于获取时间序列核,并允许使用核方法进行时间序列分类。其中一个主要挑战是核函数必须是半正定的,这一问题也将在本综述中讨论。本综述包括所有旨在使用基于距离的方法对时间序列进行分类的方法的分类,以及对每种方法的优缺点的讨论。

MSC公司:

62M10个 统计学中的时间序列、自相关、回归等(GARCH)
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Adams CC(2004)《绳结书:绳结数学理论的初步介绍》。美国数学学会,普罗维登斯·Zbl 1065.57003号
[2] Bagnall A,Janacek G(2014)用于区分自回归时间序列的游程变换。J分类31(2):274-295·Zbl 1360.62448号
[3] Bagnall A、Lines J、Bostrom A、Large J、Keogh E(2017)《伟大的时间序列分类烘烤:最近算法进展的回顾和实验评估》。数据最小知识发现31(3):606-660
[4] Bahlmann C、Haasdonk B、Burkhardt H(2002)《支持向量机在线手写识别:一种核方法》。摘自:笔迹识别前沿国际研讨会论文集,IWFHR,第49-54页
[5] Belkin M,Niyogi P(2002)嵌入和聚类的拉普拉斯特征映射和光谱技术。高级神经信息处理系统14:585-591
[6] Berndt D,Clifford J(1994)使用动态时间扭曲来发现时间序列中的模式。车间知识发现数据库398:359-370
[7] Borg I,Groenen P(1997)《现代多维尺度:理论与应用》。柏林施普林格·Zbl 0862.62052号
[8] Bostrom A,Bagnall A(2014)用于多类时间序列分类的二进制形状变换。超大规模数据知识中心系统8800:24-46
[9] Bostrom A、Bagnall A、Lines J(2016)《形状变换改进评估》。网址:www-bcf.usc.edu。2017年11月21日访问
[10] Casacuberta F,Vidal E,Rulot H(1987)关于动态时间扭曲的度量性质。IEEE跨声学语音信号处理35(11):1631-1633
[11] Chen L,Ng R(2004)关于Lp-规范和编辑距离的婚姻。In:超大数据库国际会议,第792-803页
[12] Chen P,Fan R,Lin C(2006)支持向量机SMO型分解方法研究。IEEE Trans Neural Netw学习系统17(4):893-908
[13] Chen Y,Hu B,Keogh E,Batista GEAPA(2013)DTW-D:时间序列半监督学习。摘自:第19届ACM SIGKDD知识发现和数据挖掘国际会议记录,第383页
[14] Chen Y,Garcia E,Gupta M(2009)基于相似性的分类:概念和算法。J Mach学习研究10(206):747-776·Zbl 1235.68138号
[15] Chen Y、Keogh E、Hu B、Begum N、Bagnall A、Mueen A、Batista GEAPA(2015a)UCR时间序列分类档案
[16] Chen Z,Zuo W,Hu Q,Lin L(2015b)时间序列分类的核稀疏表示。信息科学292:15-26·Zbl 1404.68095号
[17] Corduas M,Piccolo D(2008)《通过自回归度量进行时间序列聚类和分类》。计算统计数据分析52(4):1860-1872·Zbl 1452.62624号
[18] Cortes C、Vapnik V(1995)《支持向量网络》。马赫学习297:273-297·Zbl 0831.68098号
[19] Cortes C,Haffner P,Mohri M(2004)理性内核:理论和算法。J Mach学习研究5:1035-1062·Zbl 1222.68175号
[20] Cover T,Hart P(1967)最近邻模式分类。IEEE Trans-Inf理论13(1):21-27·Zbl 0154.44505号
[21] Cuturi M(2011)快速全局对齐内核。摘自:第28届ICML机器学习国际会议记录,第929-936页
[22] Cuturi M,Vert J(2007)基于全局对齐的时间序列内核。IEEE跨声学语音信号处理1:413-416
[23] Decode D,Schölkopf B(2002)使用选择性采样训练不变支持向量机。马赫学习46:161-190·Zbl 0998.68102号
[24] 丁H,Trajcevski G,Scheuermann P,Wang X,Keogh E(2008)时间序列数据的查询与挖掘:表征与距离测度的实验比较。Proc VLDB超大型数据库Endow 1(2):1542-1552
[25] Esling P,Agon C(2012),时间序列数据挖掘。ACM计算概况45(1):1-34·兹比尔1293.68104
[26] Faloutsos C,Ranganathan M,Manolopoulos Y(1994)时间序列数据库中的快速子序列匹配。摘自:ACM SIGMOD国际数据管理会议,第419-429页
[27] Freund Y,Schapire RE(1997)在线学习的决策理论推广及其在助推中的应用。计算机系统科学139:119-139·Zbl 0880.68103号
[28] Fu TC(2011)时间序列数据挖掘综述。工程应用技术情报24(1):164-181
[29] Gaidon A,Harchoui Z,Schmid C(2011)动作识别的时间序列内核。摘自:《英国机器视觉会议进程》,第63.1-63.11页
[30] Giusti R,Silva DF,Batista GEAPA(2016)使用表示多样性和SVM改进时间序列分类。In:机器学习和应用国际会议,第1-6页
[31] Grabocka J、Schilling N、Wistuba M、Schmidt-Thieme L(2014)学习时间序列形状。摘自:第20届ACM SIGKDD知识发现和数据挖掘国际会议论文集,第392-401页
[32] Graepel T,Herbrich R,Bollmann-Sdorra P,Obermayer K(1999)成对邻近数据分类。高级神经信息处理系统11:438-444
[33] Greub WH(1975)线性代数。柏林施普林格·Zbl 0317.15002号
[34] Gudmundsson S、Runarsson TP、Sigurdsson S(2008)支持向量机和时间序列的动态时间扭曲。In:神经网络联合会议(IEEE计算智能世界大会),第2772-2776页
[35] Guyon I、Schomaker L、Planiondon R、Liberman M、Janet S、Montreal Ecole Polytechnique De、Consortium Linguistic Data(1994)UNIPEN在线数据交换项目,第29-33页
[36] Haasdonk B(2005)具有不定核的SVM的特征空间解释。IEEE Trans-Pattern Ana Mach Intell 27(4):482-492
[37] Haasdonk B,Bahlmann C(2004)《距离替代核的学习》。In:联合模式识别研讨会,pp 220-227
[38] Hayashi A,Mizuhara Y,Suematsu N(2005)嵌入时间序列数据进行分类。In:模式识别中的机器学习和数据挖掘国际研讨会,第356-365页
[39] 何Q,智D,庄F,尚T,石Z(2012)基于罕见形状集的快速时间序列分类。摘自:第11届ICMLA机器学习和应用国际会议记录第1卷,第215-219页
[40] Hills J、Lines J、Baranauskas E、Mapp J、Bagnall A(2014)《通过形状变换对时间序列进行分类》。Data Min Knowl Discovery 28(4):851-881·Zbl 1298.62098号
[41] Hochreiter S,Obermayer K(2006),二元数据的支持向量机。神经计算1510:1472-1510·Zbl 1101.68762号
[42] Iwana BK,Frinken V,Riesen K,Uchida S(2017)通过不同空间嵌入区分原型实现高效时间模式识别。图案识别64:268-276·Zbl 1429.68261号
[43] Jacobs DW,Weinshall D,Gdalyahu Y(2000)非度量距离分类:图像检索和类表示。IEEE跨模式分析-马赫积分22(6):583-600
[44] Jain B,Spiegel S(2015)时间序列分类中不同空间的降维。摘自:时间数据高级分析和学习国际研讨会,第31-46页
[45] Jalalian A,Chalup SK(2013)GDTW-P-SVMs:使用支持向量机的可变长度时间序列分析。神经计算99:270-282
[46] Janyalikit T,Sathianwiriyakhun P,Sivaraks H,Ratanamahatana CA(2016)用于更快时间序列分类的增强支持向量机。参加:亚洲智能信息和数据库系统会议,第616-625页
[47] Jeong YS,Jayaraman R(2015)支持基于向量的算法和加权动态时间扭曲核函数,用于时间序列分类。基于知识的系统75(6月):184-191
[48] Jeong Y,Jeong MK,Omitaomu OA(2011)时间序列分类的加权动态时间扭曲。图案识别44(9):2231-2240
[49] Kate RJ(2015)使用动态时间扭曲距离作为改进时间序列分类的特征。数据最小知识发现30(2):283-312·Zbl 1411.62255号
[50] Kaya H,Gündüz-ÕdücüS(2013)SAGA:一种基于遗传算法的新型信号对齐方法。信息科学228:113-130
[51] Kaya H,Gündüz-ØdücüS(2015)基于距离的时间序列分类框架。信息系统51:27-42
[52] Keogh E,Kasetty S(2002)《时间序列数据挖掘基准的需求》。摘自:第八届ACM SIGKDD知识发现和数据挖掘国际会议记录,第102页
[53] Keogh E,Ratanamahatana CA(2005)动态时间扭曲的精确索引。知情信息系统7:358-386
[54] Korn F、Jagaciish HV、Faloutsos C(1997)有效支持系统大时间数据集中的即席查询序列。摘自:1997年ACM SIGMOD国际数据管理会议记录,第289-300页
[55] Kumara K、Agrawal R、Bhattacharyya C(2008)《独立于作者的在线手写分类的大幅度方法》。图案识别信29(7):933-937
[56] Lei H,Sun B(2007)《内核机器中动态时间扭曲的研究》。摘自:第三届SITIS国际IEEE会议关于信号-图像技术和基于互联网的系统的会议记录,第839-845页
[57] Lei Q,Yi J,Vaculin R,Wu L,Dhillon IS(2017)时间序列分析的相似保持表征学习。arXiv:1702.03584[cs]
[58] Leslie C,Eskin E,Noble WS(2002)光谱核:支持向量机蛋白质分类的字符串核。摘自:太平洋生物计算研讨会论文集,第564-575页
[59] Li M,Chen X,Li X,Ma B,Vitányi PMB(2004)相似性度量。IEEE Trans-Inf理论50(12):3250-3264·Zbl 1316.68052号
[60] Li X,Lin J(2018)时间序列分类的进化分离参考。摘自:2018年SIAM数据挖掘国际会议记录,第243-251页
[61] Liberman M(1993)TI46语音语料库。In:语言数据联盟
[62] Lichman M(2013)UCI机器学习库
[63] Lin J,Keogh E,Wei L,Lonardi S(2007)《体验SAX:时间序列的新型符号表示》。数据最小知识发现15(2):107-144
[64] Lines J,Bagnall A(2015)《弹性距离测度集合的时间序列分类》。数据最小知识发现29(3):565-592·Zbl 1405.68295号
[65] Lines J、Davis LM、Hills J、Bagnall A(2012)时间序列分类的形状变换。摘自:第18届ACM SIGKDD知识发现和数据挖掘国际会议记录,第289页
[66] Lods A、Malinowski S、Tavenard R、Amsaleg L(2017)《学习DTW-保持形状》。参加:智能数据分析国际研讨会。查姆施普林格,第198-209页
[67] Lu Z,Leen KT,Huang Y,Erdogmus D(2008)成对时间序列距离的再生核希尔伯特空间框架。摘自:第25届ICML机器学习国际会议记录,第56卷,第624-631页
[68] Marteau PF(2009)时间扭曲编辑距离,具有用于时间序列匹配的刚度调整。IEEE Trans-Pattern Ana Mach Intell公司31(2):306-318
[69] Marteau PF,Gibet S(2010)构建正定弹性核并应用于时间序列分类。In:CoRR,第1-18页
[70] Marteau PF,Gibet S(2014)《递归编辑距离核及其在时间序列分类中的应用》。IEEE Trans Neural Netw学习系统26(6):1-15
[71] Marteau PF,Bonnel N,Ménier G(2012)离散弹性内向量空间及其在时间序列和序列挖掘中的应用。IEEE Trans Knowl Data Eng 25(9):2024-2035
[72] Mizuhara Y,Hayashi A,Suematsu N(2006)使用动态时间扭曲距离嵌入时间序列数据。系统计算Jpn 37(3):1-9
[73] Mori U、Mendiburu A、Keogh E、Lozano JA(2017)基于随时间变化的类别区分的时间序列可靠早期分类。Data Min Knowl发现31(1):233-263
[74] Mueen A,Keogh E,Young N(2011)《逻辑形状:时间序列分类的表达原语》。摘自:第17届ACM SIGKDD知识发现和数据挖掘国际会议记录,第1154-1162页
[75] Ong CS、Mary X、Canu S、Smola AJ(2004)《使用非阳性内核学习》。摘自:第21届ICML机器学习国际会议记录,第81页
[76] Pȩkalska E,Duin RPW(2005)模式识别的差异表示:基础和应用·兹比尔1095.68105
[77] Pȩkalska E,Paclík P,Duin RPW(2001)基于差异的分类的广义核方法。J Mach学习研究2:175-211·Zbl 1037.68127号
[78] Pȩkalska E,Duin RPW,Paclík P(2006)基于异类分类器的原型选择。图案识别39(2):189-208·Zbl 1080.68646号
[79] Popivanov I,Miller RJ(2002)使用小波对时间序列数据进行相似性搜索。摘自:第18届国际数据工程会议论文集(ICDE),第212-221页
[80] Pree H、Herwig B、Gruber T、Sick B、David K、Lukowicz P(2014)《通用时间序列相似性度量及其在支持向量机中作为核函数的使用》。信息科学281:478-495
[81] Rahimi A,Recht B(2008)大型内核机器的随机特征。领域:神经信息处理系统的进展
[82] Rakthanmanon T,Keogh E(2013)《快速形状集:发现时间序列形状集的可扩展算法》。摘自:第13届ICDM数据挖掘国际会议记录,第668-676页
[83] Rasmussen C,Williams C(2006)机器学习的高斯过程。柏林施普林格·Zbl 1177.68165号
[84] Rüping S(2001)用于时间序列分析的SVM核。技术报告
[85] Sakoe H,Chiba S(1978)口语识别的动态规划算法优化。IEEE跨声学语音信号处理26(1):43-49·Zbl 0371.68035号
[86] Schölkopf B(2001)《内核学习:支持向量机、正则化、优化及超越》
[87] Senin P,Lin J,Wang X,Oates T,Gandhi S,Boedihardjo AP,Chen C,Frankenstein S,Lerner M(2014)GrammarViz 2.0:时间序列中基于语法的模式发现工具。摘自:关于数据库中机器学习和知识发现的欧洲联合会议,第468-472页
[88] SerráJ,Arcos JL(2014)时间序列分类相似性度量的实证评估。基于知识的系统67:305-314
[89] Shawe-Taylor J,Cristianini N(2004),模式分析的核方法。剑桥大学出版社·Zbl 0994.68074号
[90] Shimodaira H,Noma KI,Nakai M,Sagayama S(2002)支持向量机中的动态时间对齐核。高级神经信息处理系统2(1):921-928
[91] Sivaramakrishnan KR,Bhattacharyya C(2004)在线泰米尔手写字符识别的时间序列分类——一种基于内核的方法。在:神经信息处理国际会议,第800-805页
[92] Smyth P(1997)用隐马尔可夫模型聚类序列。高级神经信息处理系统9:648-654
[93] Sun R,Luo ZQ(2016)通过非凸分解保证矩阵完成。IEEE Trans-Inf理论62(11):6535-6579·Zbl 1359.94179号
[94] Tan PN、Steinbach M、Kumar V(2005)《数据挖掘导论》。Addison Wesley,波士顿
[95] Tax DMJ,Duin RPW(2004)支持向量数据描述。马赫学习54:45-66·Zbl 1078.68728号
[96] Troncoso A,Arias M,Riquelme JC(2015)测量时间序列相似性的多尺度平滑核。神经计算167:8-17
[97] Vapnik V(1998)统计学习理论,第2卷。纽约威利·Zbl 0935.62007号
[98] Wachman G、Khardon R、Protopapas P、Charles RA(2009)《天文学中出现的周期时间序列的核》。参加:关于数据库中的机器学习和知识发现的欧洲会议
[99] Wang X,Mueen A,Ding H,Trajcevski G,Scheuermann P,Keogh E(2013)时间序列数据表示方法和距离度量的实验比较。Data Min Knowl发现26(2):275-309
[100] Wang X,Lin J,Senin P,Alamos L,Oates T,Gandhi S,Boedihardjo AP,Chen C,Frankenstein S(2016)RPM:高效时间序列分类的代表模式挖掘。在:第19届扩展数据库技术国际会议论文集,第185-196页
[101] Weston J,Schölkopf B,Eskin E,Leslie C,Noble WS(2003)《处理核矩阵中的大对角线》。收录于:《统计数学研究所年鉴》,第55卷,第391-408页·Zbl 1172.68584号
[102] Wilson RC、Hancock ER、Pȩkalska E、Duin RPW(2014)数据的球面和双曲线嵌入。IEEE Trans-Pattern Ana Mach Intell 36(11):2255-2269
[103] Wu G,Chang EY,Zhang Z(2005a)核机器非正半定相似矩阵的变换分析。摘自:第22届ICML机器学习国际会议记录,第8页
[104] Wu G,Chang EY,Zhang Z(2005b)非度量邻近矩阵的学习。摘自:第13届ACM多媒体国际会议记录,第411页
[105] Wu L,Yen IEH,Xu F,Ravikuma P,Witbrock M(2018a)D2KE:从距离到内核和嵌入,第1-18页。arXiv公司:1802.04956
[106] Wu L,Yen IE-H,Yi J,Xu F,Lei Q,Witbrock M(2018b)随机扭曲序列:时间序列嵌入的随机特征方法。Proc Twenty-First Int Conf Artif智能统计84:793-802
[107] Xi X,Keogh E,Shelton C,Wei L,Ratanamahatana CA(2006)使用数量缩减的快速时间序列分类。摘自:第23届ICML机器学习国际会议记录,第1033-1040页
[108] Xing Z,Pei J,Keogh E(2010)《层序分类概述》。ACM SIGKDD探索者新闻12(1):40
[109] Xue Y,Zhang L,Tao Z,Wang B,Li F(2017)时间序列分类的变核变换。摘自:神经信息处理国际会议,第455-465页
[110] Ye L,Keogh E(2009)时间序列形状:数据挖掘的新原语。摘自:第15届ACM SIGKDD知识发现和数据挖掘国际会议记录,第947页
[111] Ye L,Keogh E(2011)《时间序列形状集:一种新技术,可实现准确、可解释和快速分类。Data Min Knowl发现22(1-2):149-182·Zbl 1235.68213号
[112] Zhang D,Zuo W,Zhang D,ZhangH(2010)使用高斯弹性度量核支持向量机进行时间序列分类。摘自:《模式识别国际会议论文集》,第29-32页
[113] Zhang L,Chang P,Liu J,Yan Z,Wang T,Li F(2012)基于核稀疏表示的分类器。IEEE传输信号处理60(4):1684-1695·Zbl 1393.94733号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。