×

广义随机形状森林。 (英语) Zbl 1416.62344号

小结:shapelet是时间序列的区分性子序列,通常嵌入到基于形状的决策树中。然而,时间序列形状集的枚举计算成本很高,这除了决策树学习算法有效处理高维数据的固有困难外,还严重限制了基于形状集的决策树学习在大型(多元)时间序列数据库中的适用性。本文介绍了一种利用形状集进行单变量和多变量时间序列分类的新型基于树的集成方法,称为广义随机形状集森林算法。该算法生成一组基于形状集的决策树,其中用于构建树的实例的选择和形状集的选择都是随机的。对于单变量时间序列,通过广泛的实证研究证明,所提出的算法产生的预测性能与当前最先进的算法相当,并且显著优于几种替代算法,同时至少快了一个数量级。同样,对于多元时间序列,表明该算法的计算成本显著低于当前最先进的算法,并且更准确。

理学硕士:

62H30型 分类和区分;聚类分析(统计方面)
62M10个 统计学中的时间序列、自相关、回归等(GARCH)

软件:

4.5条
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bagnall A,Lines J(2014)最近邻时间序列分类的实验评估。CoRR arXiv公司:1406.4757
[2] BankóZ(2012)基于相关性的多元时间序列动态时间扭曲。专家系统应用39(17):12814-12823·doi:10.1016/j.eswa.2012.05.012
[3] Batista GE,Wang X,Keogh EJ(2011)时间序列的复数不变距离度量。摘自:SIAM会议记录,SIAM数据挖掘国际会议,第699-710页
[4] Baydogan MG,Runger G(2014)学习多元时间序列分类的符号表示。数据最小知识发现29(2):400-422·兹比尔1403.68181 ·doi:10.1007/s10618-014-0349-y
[5] Baydogan MG,Runger G(2015)基于局部自动模式的时间序列表示和相似性。数据最小知识发现30(2):1-34
[6] Baydogan MG、Runger G、Tuv E(2013)对时间序列进行分类的bag-of-features框架。IEEE Trans-Pattern Ana Mach Intell 35(11):2796-2802·doi:10.1109/TPAMI.2013.72
[7] Berndt DJ,Clifford J(1994)使用动态时间扭曲来发现时间序列中的模式。In:KDD研讨会,知识发现和数据挖掘,第359-370页
[8] Boström H(2011)大规模随机森林的并行学习。摘自:《斯堪的纳维亚人工智能会议记录》,第20-29页
[9] Boström H(2012)概率估计树森林。国际J模式识别技术情报26(02):125-147·doi:10.1142/S021801412510019
[10] Bradley AP(1997)机器学习算法评估中roc曲线下面积的使用。图案识别30(7):1145-1159·doi:10.1016/S0031-3203(96)00142-2
[11] Breiman L(1996)装袋预测值。马赫数学习24(2):123-140·Zbl 0858.68080号
[12] Breiman L(2001)《随机森林》。马赫数学习45(1):5-32·Zbl 1007.68152号 ·doi:10.1023/A:1010933404324
[13] Breiman L、Friedman J、Stone CJ、Olshen RA(1984)分类和回归树。博卡拉顿CRC出版社·Zbl 0541.62042号
[14] Cetin MS、Mueen A、Calhoun VD(2015)多维时间序列的Shapelet集成。在:SIAM数据挖掘国际会议论文集,SIAM,第307-315页
[15] Chen L,Ng R(2004)论lp-norms与编辑距离的结合。摘自:《超大数据库国际会议论文集》,ACM,第792-803页
[16] Chen L,Øzsu MT(2005)运动物体轨迹的鲁棒快速相似性搜索。摘自:ACM SIGMOD国际数据管理会议记录,ACM,第491-502页
[17] Cortes C、Vapnik V(1995)《支持向量网络》。马赫数学习20(3):273-297·Zbl 0831.68098号
[18] Demšar J(2006)多数据集分类器的统计比较。马赫学习研究杂志7:1-30·Zbl 1222.68184号
[19] Deng H,Runger G,Tuv E,Vladimir M(2013)用于分类和特征提取的时间序列森林。信息科学239:142-153·Zbl 1321.62068号 ·doi:10.1016/j.ins/2013.02.030
[20] 丁H,Trajcevski G,Scheuermann P,Wang X,Keogh E(2008)时间序列数据的查询与挖掘:表征与距离测度的实验比较。VLDB Endow程序1(2):1542-1552·数字对象标识代码:10.14778/1454159.1454226
[21] Friedman JH(1997)《关于偏差、方差、0/1损失和维度诅咒》。数据最小知识发现1(1):55-77·doi:10.1023/A:1009778005914
[22] Fulcher BD,Jones NS(2014)基于特征的时间序列分类具有高度可比性。IEEE Trans Knowl数据工程26(12):3026-3037·doi:10.1109/TKDE.2014.2316504
[23] Gordon D、Hendler D、Rokach L(2012)基于形状的时间序列分类的快速随机模型生成。arXiv:1209.5038号
[24] Grabocka J、Schilling N、Wistuba M、Schmidt-Thieme L(2014)学习时间序列形状。摘自:第20届ACM SIGKDD知识发现和数据挖掘国际会议论文集,ACM,第392-401页
[25] Hills J、Lines J、Baranauskas E、Mapp J、Bagnall A(2014)《通过形状变换对时间序列进行分类》。数据最小知识发现28(4):851-881·Zbl 1298.62098号 ·doi:10.1007/s10618-013-0322-1
[26] Ho TK(1998)构建决策森林的随机子空间方法。IEEE Trans-Pattern Ana Mach Intell 20(8):832-844·数字对象标识代码:10.1109/34.709601
[27] Hu B,Chen Y,Keogh EJ(2013)更现实假设下的时间序列分类。摘自:SIAM国际数据挖掘会议记录,SIAM,第578-586页
[28] James GM(2003)一般损失函数的方差和偏差。马赫学习51(2):115-135·Zbl 1027.68067号 ·doi:10.1023/A:1022899518027
[29] Kampouraki A、Manis G、Nikou C(2009)《支持向量机心跳时间序列分类》。Inf-Technol生物识别13(4):512-518·doi:10.1109/TITB.2008.2003323
[30] Karlsson I,Papapetrou P,Boström H(2015)《随机形状树的森林》。收录:《统计学习与数据科学学报》,施普林格,第126-136页
[31] Keogh E,Zhu Q,Hu B,Y H,Xi X,Wei L,Ratanamahatana CA(2015)美国加州大学时间序列分类/聚类主页。www.cs.ucr.edu/emonn/time_series_data(网址:www.cs.ucr.edu/emonn/time_series_data)/
[32] Lines J,Bagnall A(2014)《弹性距离测度集合的时间序列分类》。数据最小知识发现29(3):565-592·Zbl 1405.68295号 ·doi:10.1007/s10618-014-0361-2
[33] Lines J,Davis LM,Hills J,Bagnall A(2012)时间序列分类的shapelet变换。摘自:第18届ACM SIGKDD知识发现和数据挖掘国际会议论文集,ACM,第289-297页
[34] Maier D(1978)关于子序列和超序列的一些问题的复杂性。美国临床医学杂志25(2):322-336·Zbl 0371.68018号 ·数字对象标识代码:10.1145/322063.322075
[35] Mueen A,Keogh E,Young N(2011)《逻辑形状:时间序列分类的表达原语》。摘自:第17届ACM SIGKDD知识发现和数据挖掘国际会议论文集,ACM,第1154-1162页
[36] Nanopoulos A、Alcock R、Manolopulos Y(2001),时间序列数据的基于特征的分类。国际J计算研究10:49-61
[37] Patri OP、Sharma AB、Chen H、Jiang G、Panangadan AV、Prasanna VK(2014)《从异质传感器数据中提取鉴别形状》。摘自:IEEE大数据国际会议论文集,IEEE,第1095-1104页
[38] 昆兰JR(1993)C4.5:机器学习程序。阿姆斯特丹爱思唯尔
[39] Rakthanmanon T,Keogh E(2013)《快速形状集:发现时间序列形状集的可扩展算法》。附:SIAM数据挖掘国际会议论文集
[40] Ratanamahatana CA,Keogh E(2004)关于动态时间扭曲的所有知识都是错误的。In:第三次挖掘时序数据研讨会,第22-25页
[41] Rebbapragada U,Protopapas P,Brodley CE,Alcock C(2009)《发现异常周期时间序列》。马赫学习74(3):281-313·Zbl 1470.68162号 ·doi:10.1007/s10994-008-5093-3
[42] Rodríguez JJ,Alonso CJ(2004),基于区间和动态时间扭曲的决策树。摘自:2004年ACM应用计算研讨会论文集,ACM,第548-552页
[43] Rodríguez JJ、Alonso CJ、Maestro JA(2005)时间序列分类中基于间隔特征的支持向量机。基于知识的系统18(4):171-178·doi:10.1016/j.knosys.2004.10.007
[44] Sakoe H,Chiba S(1978)口语识别的动态规划算法优化。收录:ASSP、IEEE事务处理,第43-49页·Zbl 0371.68035号
[45] Schmidhuber J(2014)《神经网络中的深度学习:概述》。arXiv:1404.7828
[46] 香农CE(1948)传播数学理论。贝尔系统技术杂志27(3):379-423·Zbl 1154.94303号 ·doi:10.1002/j.1538-7305.1948.tb01338.x
[47] Shokoohi-Yekta M,Wang J,Keogh E(2015)关于动态时间扭曲对多维情况的非平凡推广。摘自:SIAM国际数据挖掘会议记录,SIAM,第289-297页
[48] Valentini G,Dietterich TG(2004)支持向量机的偏差方差分析,用于开发基于svm的集成方法。J Mach学习研究5:725-775·兹比尔1222.68323
[49] Wang X,Mueen A,Ding H,Trajcevski G,Scheuermann P,Keogh E(2013)时间序列数据表示方法和距离度量的实验比较。数据最小知识发现26(2):275-309·doi:10.1007/s10618-012-0250-5
[50] Wistuba M、Grabocka J、Schmidt-Thieme L(2015)时间序列分类的超快速形状。CoRR arXiv公司:1503.05018
[51] Wu Y,Chang EY(2004)序列数据的距离函数设计与融合。摘自:ACM信息和知识管理国际会议记录,ACM,第324-333页
[52] Xi X,Keogh E,Shelton C,Wei L,Ratanamahatana CA(2006)使用数量缩减的快速时间序列分类。摘自:第23届机器学习国际会议论文集,ACM,第1033-1040页
[53] Ye L,Keogh E(2009)时间序列形状:数据挖掘的新原语。摘自:第15届ACM SIGKDD知识发现和数据挖掘国际会议论文集,ACM,第947-956页
[54] Ye L,Keogh E(2011)《时间序列形状集:一种新技术,可实现准确、可解释和快速分类。数据最小知识发现22(1-2):149-182·Zbl 1235.68213号 ·doi:10.1007/s10618-010-0179-5
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不声称其完整性或完全匹配。