跳到主要内容
研究论文

基于核保持嵌入的异常检测

出版:2021年5月10日出版历史
跳过抽象节

摘要

相似性表示在日益流行的异常检测技术中发挥着重要作用,这些技术已成功应用于各种真实场景。到目前为止,已经引入了许多低秩表示技术来度量数据的相似关系;然而,它们只关心最小化重建误差,而不涉及数据的结构信息。此外,传统的低阶表示方法往往以核范数作为其低阶约束,很容易产生次优解。为了解决上述问题,本文提出了一种新的异常检测方法,该方法利用核保持嵌入和双核范数来探索数据的相似关系。基于相似关系,导出了一种概率转移矩阵,并进一步采用定制的随机游走来揭示异常。所提出的方法不仅可以保持数据的流形结构特性,而且可以缓解次优问题。为了验证该方法的优越性,在12个广泛使用的数据集上对八种常用的异常检测算法进行了广泛的实验。实验结果表明,我们的检测方法在大多数情况下都优于最新的异常检测算法。

工具书类

  1. 查鲁·C·阿加瓦尔。2017年,离群值分析(第二版)。斯普林格。谷歌学者谷歌学者数字图书馆数字图书馆
  2. Leman Akoglu、Hanghang Tong和Danai Koutra。2015.基于图形的异常检测和描述:一项调查。数据挖掘和知识发现29,3(2015),626--688。谷歌学者谷歌学者数字图书馆数字图书馆
  3. 法布里齐奥·安吉乌利(Fabrizio Angiulli)。2020年CFOF:用于异常检测的无浓度测量。ACM《从数据中发现知识的汇刊》14,1(2020),1-53。谷歌学者谷歌学者数字图书馆数字图书馆
  4. 卡梅拉·科米托(Carmela Comito)、阿戈斯蒂诺·弗莱斯蒂罗(Agostino Forestiero)和克拉拉·皮祖蒂(Clara Pizzuti)。2019.推特流中的突发事件检测。ACM《从数据中发现知识的汇刊》13,4(2019),1-28。谷歌学者谷歌学者数字图书馆数字图书馆
  5. 胡荣耀、朱晓峰、朱永华和甘江章。2020年。具有自适应图学习的稳健SVM。万维网23,1(2020),1945-1968。谷歌学者谷歌学者数字图书馆数字图书馆
  6. Huaming Huang、Kishan Mehrotra和Chilukuri K.Mohan。2013.基于秩的异常值检测。《统计计算与模拟杂志》83,3(2013),518--531。谷歌学者谷歌学者交叉引用交叉引用
  7. 赵康、陆一伟、苏元璋、李长生和徐增林。2019.通过保留内核的嵌入进行相似性学习。AAAI会议记录。4057--4064.谷歌学者谷歌学者数字图书馆数字图书馆
  8. 汉斯·彼得·克里格尔(Hans-Peter Kriegel)、佩尔·克罗格(Peer Kroger)、埃里希·舒伯特(Erich Schubert)和亚瑟·齐梅克(Arthur Zimek)。2009.高维数据的轴平行子空间中的异常检测。在第13届亚洲太平洋知识发现和数据挖掘会议论文集。831--838.谷歌学者谷歌学者数字图书馆数字图书馆
  9. 胜利、明绍和云浮。2018.多视图低秩分析应用于离群值检测。ACM《从数据中发现知识的交易》12,3(2018),第32条。谷歌学者谷歌学者
  10. 林周晨,陈敏明,马毅.2009。精确恢复受损低秩矩阵的增广拉格朗日乘子方法。技术报告UILU-ENG-09-2215。UIUC大学。谷歌学者谷歌学者
  11. 刘光灿(Guangcan Liu)、林周晨(Zhouchen Lin)、颜水成(Shuicheng Yan)、孙菊(Ju Sun)、余勇(Yong Yu)和马毅(Yi Ma),2013年。基于低秩表示的子空间结构鲁棒恢复。IEEE模式分析和机器智能汇刊35,1(2013),171--184。谷歌学者谷歌学者数字图书馆数字图书馆
  12. 刘光灿、林周晨和余勇。2010.通过低秩表示的鲁棒子空间分割。第26届机器学习国际会议论文集。663--670.谷歌学者谷歌学者
  13. 刘华文、李雪龙、李久镛和张世超。2018.高效检测高维数据的离群值。IEEE系统、人与控制论汇刊:系统48,12(2018),2451-2461。谷歌学者谷歌学者交叉引用交叉引用
  14. 刘华文、李雪龙和张世超。2017.学习多标签分类的实例关联函数。IEEE控制论汇刊47,2(2017),499-510。谷歌学者谷歌学者交叉引用交叉引用
  15. 刘华文、李雪龙、张世超、祁天。2020年。采用稀疏矩阵分解的自适应散列。IEEE神经网络和学习系统汇刊31,10(2020),4318-4329。内政部:https://doi.org/10.109/TNNLS.2019.2954856谷歌学者谷歌学者交叉引用交叉引用
  16. 马丹丹、袁媛和王琦。2018.通过具有多分量稀疏表示的鉴别特征学习进行高光谱异常检测。遥感10,5(2018),745。谷歌学者谷歌学者交叉引用交叉引用
  17. 马晓晓、张向荣、徐唐、周慧玉、焦立成。2020年。基于数据驱动投影和字典构建的低秩表示的高光谱异常检测。IEEE应用地球观测和遥感专题期刊13(2020),2226-2239。谷歌学者谷歌学者交叉引用交叉引用
  18. H.D.K.Moonesinghe和Pang Ning Tan。2008.Outrank:使用随机游走的基于图形的异常值检测框架。《国际人工智能工具杂志》17,1(2008),19-36。谷歌学者谷歌学者交叉引用交叉引用
  19. Mostafa Rahmani和George K.Atia。2017.一致性追求:快速、简单、稳健的主成分分析。IEEE信号处理学报65,23(2017),6260--6275。谷歌学者谷歌学者交叉引用交叉引用
  20. 商繁华、程詹姆斯、刘媛媛、罗志全和林周晨。2018。鲁棒PCA的双线性因子矩阵范数最小化:算法和应用。IEEE模式分析和机器智能汇刊40,9(2018),2066--2080。谷歌学者谷歌学者数字图书馆数字图书馆
  21. 沈恒涛、朱永华、郑伟和朱晓峰。2020。不完整数据无监督特征选择的半二次最小化。IEEE神经网络和学习系统汇刊(2020),10.1109/TNNLS.2020.3009632。谷歌学者谷歌学者交叉引用交叉引用
  22. Mahdi Soltanolkotabi和Emmanuel J.Candes。2012.带离群值的子空间聚类的几何分析。《统计年鉴》44,4(2012),2195-2238。谷歌学者谷歌学者
  23. N.N.R.Ranga Suri、Murty M.Narasimha和G.Athithan。2019.孤立点检测:技术与应用(第1版)。斯普林格。谷歌学者谷歌学者交叉引用交叉引用
  24. Manolis C.Tsakiris和Rene Vidal。2015年,双重主成分追求。在ICCV关于稳健子空间学习和计算机视觉的研讨会论文集上。10--18.谷歌学者谷歌学者
  25. 王超、刘震、高慧和严复。2019.Vos:使用虚拟图的新异常值检测模型。基于知识的系统185(2019),104907。谷歌学者谷歌学者数字图书馆数字图书馆
  26. 约翰·赖特(John Wright)、马毅(Yi Ma)、朱利安·迈拉尔(Julien Mairal)、吉列尔莫·萨皮罗(Guillermo Sapiro)、托马斯·黄(Thomas S.Huang)和颜水成(Shuicheng。2010年。计算机视觉和模式识别的稀疏表示。程序。IEEE 98,6(2010),1031--1044。谷歌学者谷歌学者交叉引用交叉引用
  27. 许欢(Huan Xu)、君士坦丁·卡拉马尼斯(Constantine Caramanis)和苏杰·桑哈维(Sujay Sanghavi)。2012.通过异常值追踪实现稳健PCA。IEEE信息理论汇刊58,5(2012),3047--3064。谷歌学者谷歌学者数字图书馆数字图书馆
  28. 徐晓丹、刘华文和姚明海。2019.异常检测的最新进展。复杂性(2019),2686378:1–2686378/11。谷歌学者谷歌学者
  29. Chong You、Daniel P.Robinson和Rene Vidal。2017.子空间并集中可证明的基于自表示的异常值检测。IEEE计算机视觉和模式识别会议论文集。3395--3404.谷歌学者谷歌学者交叉引用交叉引用
  30. 张恒敏、杨健、尚繁华、陈功和张振宇。2019.通过易处理的Schatten范数最小化和因子分解实现子空间分割的LRR。IEEE控制论汇刊49,5(2019),1722-1734。谷歌学者谷歌学者交叉引用交叉引用
  31. Ke Zhang、Marcus Hutter和Huidong Jin。2009.一种新的基于局部距离的孤立点检测方法,用于分散的真实世界数据。第13届太平洋亚洲会议论文集。知识发现和数据挖掘。813--822.谷歌学者谷歌学者数字图书馆数字图书馆
  32. 赵章、李凡章、赵明波、李章和严水成。2016.联合低秩和稀疏主特征编码,以增强鲁棒表示和视觉分类。IEEE图像处理汇刊25,6(2016),2429--2443。谷歌学者谷歌学者数字图书馆数字图书馆
  33. Zhao Zhang、Fanzhang Li、Mingbo Zhao、Li Zhang和Waicheng Yan。2017.通过Nuclear/L2,1-形式正则化进行稳健邻域保持投影,用于图像特征提取。IEEE图像处理汇刊26,4(2017),1607--1622。谷歌学者谷歌学者数字图书馆数字图书馆
  34. 朱晓峰(Xiaofeng Zhu)、甘江章(Jiangzhang Gan)、卢光泉(Guangquan Lu)、李嘉业(Jiaye Li)和张士超(Shichao Zhang)。2020年,通过半二次优化进行光谱聚类。万维网23,3(2020),1969-1988。谷歌学者谷歌学者数字图书馆数字图书馆
  35. 朱晓峰、张世超、李永刚、张继莲、杨立峰、岳芳。2019.用于谱聚类的低秩稀疏子空间。IEEE知识与数据工程汇刊31,8(2019),1532--1543。谷歌学者谷歌学者数字图书馆数字图书馆
  36. 亚瑟·齐梅克(Arthur Zimek)和彼得·菲尔兹莫瑟(Peter Filzmoser)。2018年:统计推理和数据挖掘算法之间的异常检测。Wiley跨学科评论:数据挖掘和知识发现8,6(2018),e1280。谷歌学者谷歌学者交叉引用交叉引用
  37. 亚瑟·齐梅克和埃里希·舒伯特。2018.异常检测。在数据库系统百科全书(第二版)中,Ling Liu和M.Tamerzsu(编辑)。施普林格,第1章,1--5。谷歌学者谷歌学者

索引术语

  1. 基于核保持嵌入的异常检测

          建议

          评论

          登录选项

          检查您是否可以通过登录凭据或您的机构访问本文。

          登录

          完全访问权限

          • 发布于

            从数据中发现知识的封面图像ACM事务
            ACM数据知识发现事务 第15卷第5期
            2021年10月
            508页
            国际标准编号:1556-4681年
            EISSN公司:1556-472倍
            内政部:10.1145/3461317
            期刊目录

            版权所有©2021 ACM

            允许制作本作品的全部或部分数字或硬拷贝供个人或课堂使用,但不收取任何费用,前提是复制品的制作或分发不是为了盈利或商业利益,并且复制品在首页注明本通知和完整引文。必须尊重ACM以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布、在服务器上发布或重新分发到列表,需要事先获得特定许可和/或收取费用。从请求权限[电子邮件保护]

            出版商

            计算机协会

            美国纽约州纽约市

            出版历史

            • 出版:2021年5月10日
            • 修订过的:2021年1月1日
            • 认可的:2021年1月1日
            • 收到:2020年7月1日
            发布于tkdd公司第15卷第5期

            权限

            请求有关此文章的权限。

            请求权限

            检查更新

            限定符

            • 研究论文
            • 研究
            • 参考

          PDF格式

          以PDF文件查看或下载。

          PDF格式

          电子阅读器

          使用eReader联机查看。

          电子阅读器

          HTML格式

          以HTML格式查看本文。

          查看HTML格式