×

可扩展的时间序列分类。 (英语) Zbl 1416.62526号

摘要:时间序列分类试图模仿人类对相似性的理解。当涉及到较长或较大的时间序列数据集时,最先进的分类器由于训练或测试时间过长而达到了极限。一个典型的例子是常用作比较基准的1-最近邻动态时间扭曲分类器(1-NN DTW)。它有几个缺点:时间序列长度具有二次时间复杂度,并且在存在噪声的情况下其精度会下降。为了降低计算复杂性,引入了早期放弃技术、级联下限或最近引入的最近形心分类器。然而,数千个时间序列的数据集的分类时间是按小时计算的。我们在向量空间分类器中提出了我们的Bag-Of-SFA符号,它准确、快速且对噪声鲁棒。我们表明,它比1-NN DTW更准确,同时速度快多个数量级。它的低计算复杂度和良好的分类准确度使其适用于长时间或大量时间序列或实时分析等用例。

MSC公司:

62M10个 统计学中的时间序列、自相关、回归等(GARCH)
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Aucouturier JJ,Defreville B,Pachet F(2007)音频模式识别的bag-of-frames方法:一个适用于城市声景但不适用于复调音乐的足够模型。美国科学院学报122(2):881-891·doi:10.1121/1.2750160
[2] Bagnall A、Lines J、Hills J、Bostrom A(2015)《COTE的时间序列分类:基于转换的信号群集合》。IEEE Trans Knowl数据工程27(9):2522-2535·doi:10.1109/TKDE.2015.2416723
[3] Bagnall A、Davis LM、Hills J、Lines J(2012),时间序列分类的基于变换的信号群。摘自:2012年SIAM数据挖掘国际会议记录,第12卷。SIAM,第307-318页
[4] Bagnall A,Lines J(2014)最近邻时间序列分类的实验评估。arXiv:1406.4757
[5] Batista G,Wang X,Keogh EJ(2011)时间序列的复数不变距离度量。收录于:2011年SIAM数据挖掘国际会议论文集。SIAM,第699-710页
[6] Baydogan MG、Runger G、Tuv E(2013)对时间序列进行分类的bag-of-features框架。IEEE Trans-Pattern Ana Mach Intell 35(11):2796-2802·doi:10.10109/TPAMI.2013.72
[7] Demšar J(2006)多数据集分类器的统计比较。J Mach学习研究7:1-30·Zbl 1222.68184号
[8] Ding H,Trajcevski G,Scheuermann P,Wang X,Keogh E(2008)时间序列数据的查询和挖掘:表征X和距离测度的实验比较。附:VLDB捐赠会议记录。2号,VLDB捐赠,第1542-1552页
[9] Esling P,Agon C(2012),时间序列数据挖掘。ACM计算概况45(1):12:1-12:34·Zbl 1293.68104号 ·数字对象标识代码:10.1145/2379776.2379788
[10] Grabocka J、Schilling N、Wistuba M、Schmidt-Thieme L(2014)学习时间序列形状。2014年ACM SIGKDD知识发现和数据挖掘国际会议论文集。美国医学会392-401
[11] Hu B,Chen Y,Keogh E(2013)更现实假设下的时间序列分类。摘自:2013年SIAM数据挖掘国际会议记录。SIAM,第578-586页
[12] Jerzak Z,Ziekow H(2014)DEBS 2014大挑战。摘自:2014年ACM分布式事件系统国际会议记录。ACM,第266-269页
[13] Kumar N、Lolla VN、Keogh EJ、Lonardi S、Ratanamahatana CA(2005)《时间序列位图:使用大型时间序列数据库的实用可视化工具》。摘自:2005年SIAM数据挖掘国际会议记录。SIAM,第531-535页
[14] Lin J,Keogh EJ,Wei L,Lonardi S(2007)《体验SAX:时间序列的新型符号表示》。数据最小知识发现15(2):107-144·数字对象标识码:10.1007/s10618-007-0064-z
[15] Lin J,Khade R,Li Y(2012)使用纸袋表示的时间序列中的旋转不变相似性。智能信息系统杂志39(2):287-315·doi:10.1007/s10844-012-0196-5
[16] Lines J,Bagnall A(2014)《弹性距离测度集合的时间序列分类》。数据最小知识发现29(3):565-592·Zbl 1405.68295号 ·doi:10.1007/s10618-014-0361-2
[17] Mueen A,Keogh EJ,Young N(2011)《逻辑形状:时间序列分类的表达原语》。在:2011年ACM SIGKDD知识发现和数据挖掘国际会议论文集。ACM,第1154-1162页
[18] Mutschler C、Ziekow H、Jerzak Z(2013)2013年DEBS大挑战。摘自:2013年ACM分布式事件系统国际会议记录。ACM,第289-294页
[19] Petitjean F、Forestier G、Webb GI、Nicholson AE、Chen Y、Keogh E(2014)时间序列的动态时间扭曲平均可以更快、更准确地进行分类。摘自:2014年IEEE数据挖掘国际会议记录,IEEE,第470-479页
[20] Rakthanmanon T、Campana B、Mueen A、Batista G、Westover B、Zhu Q、Zakaria J、Keogh E(2012)在动态时间扭曲下搜索和挖掘数万亿时间序列子序列。2012年ACM SIGKDD知识发现和数据挖掘国际会议论文集。ACM,第262-270页
[21] Rakthanmanon T,Keogh E(2013)《快速形状集:发现时间序列形状集的可扩展算法》。摘自:2013年SIAM数据挖掘国际会议记录。暹罗
[22] Salton G,Wong A,Yang CS(1975)自动索引的向量空间模型。通信ACM 18(11):613-620·Zbl 0313.68082号 ·数字对象标识代码:10.1145/361219.361220
[23] Schäfer P(2014)《无需人工预处理的时间序列分类》。领域:模式识别中的机器学习和数据挖掘。柏林施普林格,第228-242页
[24] Schäfer P(2015)BOSS关注噪声存在下的时间序列分类。数据最小已知Discov 29(6):1505-1530·Zbl 1405.68305号 ·doi:10.1007/s10618-014-0377-7
[25] Schäfer P,Högqvist M(2012)SFA:符号傅里叶近似和高维数据集相似性搜索索引。摘自:2012年关于扩展数据库技术的国际会议记录。ACM,第516-527页
[26] Senin P,Malinchik S(2013)SAX-VSM:使用SAX和向量空间模型进行可解释的时间序列分类。摘自:2013年IEEE数据挖掘国际会议论文集。IEEE,第1175-1180页
[27] Urbanski J、Weber M(2012)《Praxiseinsatz-Szenarien的大数据》,贝斯皮尔,埃菲克特。http://www.bitkom.org/files/documents/bitkom_LF_big_data_2012_online网站(1)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。