×

基于形状学习的时间序列异常检测。 (英语) Zbl 1505.62059号

摘要:我们考虑学习从未标记的数据集中检测异常时间序列的问题,这些数据可能被训练数据中的异常污染。这种情况对于在医学、经济或工业质量控制中的应用非常重要,因为在这些应用中,标记很困难,需要昂贵的专家知识,并且很难获得异常数据。提出了一种基于时间序列形状变换的无监督异常检测新方法。我们的方法学习描述来自正常类的时间序列形状的代表性特征,同时学习准确检测异常时间序列。提出了一个目标函数,它鼓励学习一种特征表示,其中正常时间序列位于特征空间的紧致超球面内,而异常观测值位于决策边界之外。该目标通过块坐标下降程序进行优化。我们的方法可以通过重用学习的特征表示,在不需要重新训练模型的情况下,有效地检测未知测试数据中的异常时间序列。我们在多个基准数据集上证明了我们的方法能够可靠地检测出异常时间序列,并且当训练实例包含异常时间序列时,该方法比竞争方法更加稳健。

MSC公司:

62-08 统计问题的计算方法
62米10 统计学中的时间序列、自相关、回归等(GARCH)
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bagnall A,Lines J,Bostrom A,Large J,Keogh E(2017a)伟大的时间序列分类烘焙:对最新算法进展的回顾和实验评估。Data Min Knowl光盘31(3):606-660
[2] Bagnall A,Lines J,Vickers W,Keogh E(2017b)UEA&UCR时间序列分类库。www.timeseriesclassification.com。2017年12月访问
[3] Boyd S,Vandenberghe L(2004)凸优化。剑桥大学出版社·Zbl 1058.90049号
[4] Boyd S,Xiao L,突变型A(2003)亚梯度方法。EE392o讲座笔记,斯坦福大学,2004年秋季季度。http://web.mit.edu/6.976/www/notes/subgrad_method.pdf
[5] Brodersen KH、Ong CS、Stephan KE、Buhmann JM(2010)《平衡精度及其后验分布》。摘自:《第20届模式识别国际会议论文集》,IEEE,土耳其伊斯坦布尔,第3121-3124页
[6] Chandola V(2009)符号序列和时间序列数据的异常检测。明尼苏达大学博士论文
[7] Chandola V、Banerjee A、Kumar V(2009)《异常检测:一项调查》。ACM计算调查(CSUR)41(3):1-58
[8] Chatfield C(2016)《时间序列分析:导论》,第6版。查普曼和霍尔,英国伦敦·Zbl 1050.62089号
[9] Chuah MC,Fu F(2007)通过时间序列分析进行心电图异常检测。作者:Thurasiraman P、He X、Xu TL、Denko MK、Thurasiram RK、Yang LT(编辑),《高性能计算和网络前沿ISPA 2007研讨会》。计算机科学讲义,第4743卷,柏林斯普林格,海德堡,第123-135页
[10] Emmott AF、Das S、Dietterich T、Fern A、Wong WK(2013),从实际数据系统构建异常检测基准。摘自:ACM SIGKDD异常值检测和描述研讨会论文集,ACM,芝加哥,伊利诺伊州,第16-21页
[11] Esling P,Agon C(2012),时间序列数据挖掘。ACM计算调查(CSUR)45(1):1-34·Zbl 1293.68104号
[12] Ferrell B,Santuro S(2015)美国宇航局梭阀数据。网址:http://www.cs.fit.edu/pkc/nasa/数据/
[13] Forrest S、Hofmeyr SA、Somayaji A、Longstaff TA(1996)unix进程的自我意识。在:1996年IEEE安全与隐私研究研讨会论文集,IEEE,第120-128页
[14] Fu AWC,Leung OTW,Keogh E,Lin J(2006)基于haar变换的时间序列不一致性发现。收件人:Li X,Za ie ane OR,Li Z(eds)高级数据挖掘和应用国际会议论文集,柏林斯普林格,海德堡,第31-41页
[15] Grabocka J、Schilling N、Wistuba M、Schmidt-Thieme L(2014)学习时间序列形状。摘自:第20届ACM SIGKDD知识发现和数据挖掘国际会议论文集,美国纽约ACM,第392-401页
[16] Grafter FJ,Wallnau LB(2017)《行为科学统计》,第10版。波士顿Cengage Learning
[17] Hyndman RJ(1996)计算和绘制最高密度区域。美国统计50(2):120-126
[18] Hyndman RJ,Wang E,Laptev N(2015a)异常——用于异常时间序列检测的R包。https://github.com/robjhyndman/enovative
[19] Hyndman RJ,Wang E,Laptev N(2015b)《大尺度异常时间序列检测》。摘自:2015年IEEE数据挖掘研讨会国际会议记录,IEEE,美国新泽西州大西洋城,第1616-1619页
[20] Keogh E,Kasetty S(2003)《时间序列数据挖掘基准的必要性:调查和实证研究》。数据最小已知盘7(4):349-371
[21] Keogh E,Lin J,Fu A(2005)热萨克斯:高效发现最不寻常的时间序列子序列。摘自:第五届IEEE数据挖掘国际会议记录,IEEE,美国德克萨斯州休斯顿,第226-233页
[22] Lines J、Davis LM、Hills J、Bagnall A(2012)时间序列分类的形状变换。摘自:第18届ACM SIGKDD知识发现和数据挖掘国际会议论文集,ACM,中国北京,第289-297页
[23] Ma J,Perkins S(2003)使用单类支持向量机的时间序列新颖性检测。摘自:美国俄勒冈州波特兰IEEE第九届国际神经网络联合会议论文集,第3卷,第1741-1745页
[24] Mahoney MV,Chan PK(2005),用于异常检测的时间序列轨迹边界建模。In:美国拉斯维加斯KDD异常检测数据挖掘方法KDD研讨会论文集
[25] Pateiro-López B,Rodríguez-Casal A(2010)概括样本的凸包:R包alphahull。J Stat Softw统计软件34(5):1-28
[26] Protopapas P、Giammarco JM、Faccioli L、Struble MF、Dave R、Alcock C(2006),在周期性变星目录中发现异常光曲线。Mon Not R Astron Soc 369(2):677-696
[27] Rebbapragada U,Protopapas P,Brodley CE,Alcock C(2009)《发现异常周期时间序列》。马赫学习74(3):281-313·Zbl 1470.68162号
[28] Salvador S,Chan P(2005)《学习时间序列异常检测的状态和规则》。应用Intel 23(3):241-255
[29] Schölkopf B,Smola AJ,Williamson RC,Bartlett PL(2000)新支持向量算法。神经计算12(5):1207-1245
[30] Tax DM,Duin RP(2004)支持向量数据描述。马赫数学习54(1):45-66·Zbl 1078.68728号
[31] Thomas A、Clemencon S、Feuillard V、Gramfort A(2016)《非监督异常检测的学习超参数》。在:2016年机器学习国际会议论文集异常检测研讨会,美国纽约
[32] Wei L,Keogh E,Xi X(2006)《SAX外显图像:发现异常形状》。摘自:2006年IEEE第六届数据挖掘国际会议记录,IEEE,中国香港,第711-720页
[33] Ye L,Keogh E(2009)时间序列形状:数据挖掘的新原语。摘自:第15届ACM SIGKDD知识发现和数据挖掘国际会议论文集,ACM,法国巴黎,第947-956页
[34] Zhong S,Khoshgoftaar TM,Seliya N(2007)基于聚类的网络入侵检测。国际J Reliab Qual Saf Eng 14(02):169-187
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。