×

异常检测的极值理论——GPD分类器。 (英语) Zbl 1469.62256号

作为异常检测,人们理解区分正常和异常测试数据点的任务。本文的目的是介绍一种新的异常检测分类器。本文的第二部分致力于简要介绍异常检测领域的主要贡献,指出极值理论、机器学习技术或神经网络的重要性。本文的第三和第四部分介绍了单变量极值理论及其主要结果,并对异常检测任务进行了形式化描述。在第五部分中,我们发现了由E.M.拉德等[“极值机器”,IEEE Trans.Pattern Anal.Mach.Intell.40,No.3,762-768(2018;doi:10.10109/TPAMI.2017.20707495文件)]. 显示了EVM的局限性。此外,在本文的下一部分,作者开发了两种新的无核算法,它们使用极值理论执行异常检测。一种称为GPDC的算法主要关注被分类为正常或异常的点与训练数据集中的点之间的距离。第二种算法称为GEVC算法,基于GEV分布的近似。另请参见[S.科尔斯,极值统计建模简介。伦敦:斯普林格出版社(2001;Zbl 0980.62043号)]. 将新的GPDC和GEVC算法与EVM算法在仿真和实际数据上进行了比较,并对其性能进行了重点讨论。

MSC公司:

62G32型 极值统计;尾部推断
62H30型 分类和区分;聚类分析(统计方面)
68T05年 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: DOI程序

参考文献:

[1] Abe,N.、Zadrozny,B.、Langford,J.:通过主动学习检测离群值。参加:知识发现和数据挖掘国际会议。ACM(2006)
[2] Arya,S.,Mount,D.M.,Netanyahu,N.S.,Silverman,R.,Wu,A.Y.:近似最近邻搜索固定维的最佳算法。ACM杂志45(6)(1998)·Zbl 1065.68650号
[3] Bendale,A.,Boult,T.:走向开放世界的认可。In:IEEE计算机视觉和模式识别会议(2015)
[4] Bishop,C.M.:新颖性检测和神经网络验证。IEE进展——视觉、图像和信号处理141(4)(1994)
[5] Bradley,A.P.:机器学习算法评估中ROC曲线下面积的使用。模式识别30(7)(1997)
[6] Cai,J.、Einmahl,J.和De Haan,L.等人:多元规则变化下极端风险区域的估计。《统计年鉴》39(3)(2011)·Zbl 1221.62075号
[7] Chandola,V.,Banerjee,A.,Kumar,V.:异常检测:一项调查。ACM计算调查(CSUR)41(3)(2009)
[8] Christopher,MB,模式识别和机器学习(2016),纽约:Springer,纽约
[9] 科尔斯,S。;Bawa,J。;特伦纳,L。;Dorazio,P.,《极值统计建模导论》(2001),柏林:施普林格出版社,柏林·Zbl 0980.62043号
[10] De Haan,L。;Ferreira,A.,《极端价值理论:导论》(2007),柏林:施普林格科学与商业媒体出版社,柏林
[11] Deng,J.,Dong,W.,Socher,R.,Li,L.-J.,Li.,K.,Fei-Fei,L.:ImageNet:大型分层图像数据库。参加:计算机视觉和模式识别会议(2009年)
[12] Désir,C.,Bernard,S.,Petitjean,C.,Heutte,L.:一类随机森林。模式识别46(12)(2013)
[13] Dua,D.,Graff,C.:UCI机器学习库。http://archive.ics.uci.edu/ml (2017)
[14] Einmahl,J.,Li,J..,Liu,R.,et al.:桥接中心性和极端性:使用极值统计精炼经验数据深度。《统计年鉴》43(6)(2015)·Zbl 1327.62205号
[15] Embrechts,P。;Klüppelberg,C。;Mikosch,T.,《模拟极端事件:保险和金融》,第33卷(2013年),柏林:Springer科学与商业媒体,柏林
[16] Fragoso,V.,Sen,P.,Rodriguez,S.,Turk,M.:EVSAC:通过建模匹配分数与极值理论加速假设生成。参加:IEEE计算机视觉国际会议(2013)
[17] Frey,P.W.,Slate,D.J.:使用荷兰风格自适应分类器的字母识别。机器学习6(2)(1991)
[18] Geng,C.,Huang,S.,Chen,S.:开放集识别的最新进展:一项调查。预印arXiv:1811.08581(2018)
[19] Goix,N.,Sabourin,A.,Clemencon,S.:多元极值的稀疏表示及其在异常排序中的应用。In:AISTATS(2016)·Zbl 1373.62252号
[20] Graves,A.,Mohamed,A.,Hinton,G.:使用深度递归神经网络进行语音识别。参加:IEEE声学、语音和信号处理国际会议(2013年)
[21] 霍尔,P.:关于估计分布的端点。统计年鉴10(2)(1982)·Zbl 0489.62029号
[22] He,K.,Zhang,X.,Ren,S.,Sun,J.:图像识别的深度剩余学习。摘自:IEEE计算机视觉和模式识别会议记录(2016年)
[23] He,Y.,Einmahl,J.:基于极端深度的分位数区域的估计。J.R.统计社会服务。B.统计方法。79 (2017) ·兹伯利1414.62161
[24] Hill,B.M.:推断分布尾部的简单通用方法。《统计年鉴》,第1163-1174页(1975年)·Zbl 0323.62033号
[25] Huang,J.,Ling,C.X.:使用AUC和准确性评估学习算法。IEEE知识与数据工程汇刊17(3)(2005)
[26] Jalalzai,H.,Clémençon,S.,Sabourin,A.:关于极端地区的二元分类。主题:神经信息处理系统进展(2018)
[27] 詹姆斯·G。;维滕,D。;哈斯蒂,T。;Tibshirani,R.,《统计学习导论》(2013),柏林:施普林格出版社,柏林·Zbl 1281.62147号
[28] Krizhevsky,A.,Hinton,G.:从微小图像中学习多层特征。多伦多大学技术报告(2009年)
[29] Liu,F.T.,Ting,K.M.,Zhou,Z.:基于隔离的异常检测。ACM数据知识发现交易(TKDD)6(1)(2012)
[30] Mensink,T.、Verbeek,J.、Perronnin,F.、Csurka,G.:大规模图像分类的度量学习:以接近零的成本推广到新类。参加:欧洲计算机视觉会议。柏林施普林格出版社(2012)
[31] Nguyen,A.,Yosinski,J.,Clune,J.:深层神经网络很容易被愚弄:对无法识别的图像的高置信度预测。In:IEEE计算机视觉和模式识别会议(2015)
[32] Pimentel,M.A.F.,Clifton,D.A.,Clifon,L.,Tarassenko,L.:新颖性检测综述。信号处理。99 (2014)
[33] Quinlan,J.R.,Compton,P.J.,Horn,K.A.,Lazarus,L.:归纳知识获取:案例研究。摘自:第二届澳大利亚专家系统应用会议记录(1986年)
[34] Rebuffi,S.,Kolesnikov,A.,Lampert,C.H.:icaRL:增量分类器和表示学习。参加:计算机视觉和模式识别会议(2017年)
[35] Roberts,S.J.:使用极值统计进行新颖性检测。IEE进展——视觉、图像和信号处理146(3)(1999)
[36] Rudd,E.M.,Jain,L.P.,Scheirer,W.J.,Boult,T.E.:极值机器。IEEE模式分析和机器智能汇刊40(3)(2018)
[37] Ruping,S.:支持向量机的增量学习。收录:IEEE数据挖掘国际会议(2001年)
[38] Saffari,A.、Leistner,C.、Santner,J.、Godec,M.、Bischof,H.:在线随机森林。参加:IEEE国际计算机视觉研讨会(2009年)
[39] 谢尔,W.J.:基于极值理论的视觉识别方法。计算机视觉综合讲座7(1)(2017)
[40] Scheire,W.J.、Rocha,A.、Micheals,R.J.、Boult,T.E.:元认知:认知得分分析的理论与实践。IEEE模式分析和机器智能汇刊33(8)(2011)
[41] Schiffmann,W.,Joost,M.,Werner,R.:多层神经网络架构的综合和性能分析。科布伦茨大学技术报告(1992年)
[42] Schölkopf,B.,Williamson,R.C.,Smola,A.J.,Shawe-Taylor,J.,Platt,J.C.:新颖性检测的支持向量方法。In:神经信息处理系统进展(2000)
[43] Shaffer,J.P.:多重假设检验。心理学年鉴46(1)(1995)
[44] Shon,T.,Moon,J.:网络异常检测的混合机器学习方法。信息科学177(18)(2007)
[45] Siffer,A.、Fouque,P.、Termier,A.、Largouet,C.:利用极值理论检测流中的异常。摘自:第23届ACM SIGKDD知识发现和数据挖掘国际会议记录(2017年)
[46] Thomas,A.,Clemencon,S.,Gramfort,A.,Sabourin,A.:通过球面上的经验MV-set在极端区域进行异常检测。In:AISTATS(2017)
[47] Walfish,S.:统计异常值方法综述。制药技术30(11)(2006)
[48] Weissman,I.:基于k个最大观测值的参数和大分位数估计。J.Amer。统计师。协会73(1978)·Zbl 0397.62034号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。