×

一类近似支持向量机。 (英语) Zbl 1394.68283号

摘要:最近,在[第一作者,“离群值检测的一类核Fisher准则”,IEEE Trans.Neural Netw.Learn.Syst.2,No.1,1–99(2014)]中,提出了一种新的Fisher型对比度测量,以提取受离群值污染的数据集中的目标人群。虽然在数学上是合理的,但这项工作在形式主义和使用领域都存在一些进一步的缺陷。首先,我们建议从中介绍的最近邻支持向量机的形式化重新表述这个问题[O.L.Mangasarian公司E.W.野生,“基于广义特征值的多表面近端支持向量机分类”,IEEE Trans。模式分析。机器。智力。28,第1期,69–74页(2006年;doi:10.1109/tpami.2006.17)]. 这一改变远非无害,因为它引入了一种适合解决问题的写作方式。该方法的另一个限制因素是,其性能依赖于目标和异常值之间的密度不同的假设。对于现实世界的数据集,这种考虑很容易被证明是过于乐观的,这使得该方法不可靠,至少直接不可靠。决策边界的计算是该算法的一个耗时部分,因为它是基于求解广义特征值问题(GEP)。因此,此方法仅限于中等大小的数据集。在本文中,我们提出了适当的策略来消除所有这些缺点,并充分受益于该方法的利益。首先,我们证明在某些条件下,生成适当的人工离群值可以保持在方法的约束范围内,从而扩大了使用条件。其次,我们证明了GEP可以被共轭梯度解(CG)有利地替换,从而显著降低了计算成本。最后,在合成数据集和实际数据集上,将该算法与最新的新颖检测器进行了比较。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)

软件:

开放式基金
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Dufrenois,F.,离群值检测的一类核Fisher准则,IEEE Trans。神经网络。学习。系统。,2, 1, 1-99, (2014)
[2] Mangasarian,O。;Wild,E.,基于广义特征值的多表面近端支持机分类,IEEE Trans。模式分析。机器。智力。,28, 1, 69-74, (2006)
[3] 巴内特,V。;Lewis,T.,《统计数据中的异常值》(1994),约翰威利·Zbl 0801.62001
[4] M.Breunig,H.Kriegel,R.T.Ng,J.Sander,Lof:识别基于密度的局部异常值,摘自:《国际数据管理会议论文集》,2000年,第93-104页。
[5] H.Kriegel、P.Kroger、E.Schubert、A.Zimek,《回路:局部异常概率》,摘自:《2009年国际信息与知识管理会议论文集》,第1649-1652页。
[6] E.Schubert,A.Zimek,H.Kriegel,《具有灵活核密度估计的广义异常值检测》,载于《第14届SIAM国际数据挖掘会议论文集》,费城,2014年·Zbl 1281.68192号
[7] S.Jiang,Q.An,基于聚类的离群值检测方法,载《模糊系统与知识发现国际会议》,2008年,第429-433页。
[8] R.Smith,A.Bivens,M.Embrechts,C.Palagiri,B.Szymanski,基于异常的入侵检测聚类方法,收录于:《通过人工神经网络的智能工程系统学报》,2002年,第579-584页。
[9] Schölkopf,B。;Smola,A。;威廉姆森,R。;Bartlett,P.,新支持向量算法,神经计算。,第12卷,1083-1121,(2000)
[10] 税务,D。;Duin,R.,支持向量领域描述,模式识别。莱特。,20, 1191-1199, (1999)
[11] Hoffmann,H.,新颖性检测的核主成分分析,模式识别。,40, 3, 863-874, (2007) ·Zbl 1118.68140号
[12] Shen Y.,A.Izenman,使用带径向基函数核的最小核主成分进行异常值检测,载于:联合统计会议,2008年。
[13] Roth,V.,Kernel Fisher离群值检测判别法,神经计算。,18, 942-960, (2006) ·兹比尔1095.68673
[14] 税务博士,一级分类(博士论文),代尔夫特理工大学,2001年。
[15] 杜弗雷诺伊斯(F.Dufrenois)。;Noyer,J.,将稳健线性回归估计公式化为一类lda标准判别帽矩阵,IEEE Trans。神经网络。学习。系统。,24, 2, 262-273, (2013)
[16] C.Ding,T.Li,使用判别分析和k-means聚类进行自适应降维,载《第24届机器学习国际会议论文集》,2007年,第521-528页。
[17] F.de la Torre Frade,T.Kanade,判别聚类分析,摘自:《第23届机器学习国际会议论文集》,美国,2006年,第241-248页。
[18] Chatterjee,S。;Hadi,A.,线性回归中的敏感性分析,(1988),威利纽约·Zbl 0648.62066号
[19] 叶建中,赵中明,吴明明,聚类的判别k-means,收录于:神经信息与处理系统,2007年。
[20] 税务,D。;Duin,R.,优化单类分类器的统一对象生成,J.Mach。学习。《决议》,第2卷,155-173,(2001)·Zbl 1002.68599号
[21] A.Banhalmi,A.Kocsor,R.Busa-Fekete,基于反示例生成的单类分类,收录于:《第18届欧洲机器学习会议论文集》,2007年,第543-550页。
[22] W.Zhu,S.Wang,R.Lin,S.Levinson,用svm回归跟踪对象,在:IEEE计算机视觉模式识别会议,2001年,第240-245页。
[23] W.Fan,M.Miller,S.J.Stolfo,W.Lee,《使用人工异常检测未知和已知网络入侵》,收录于:《第一届IEEE数据挖掘国际会议论文集》,2001年,第123-130页。
[24] Schölkopf,B。;Smola,A.,《用内核学习》(2002),麻省理工学院出版社
[25] E.Pekalska,D.Tax,R.Duin,用于不同表示的一类LP分类器,神经信息处理。系统。15 (2003).
[26] Hido,S。;Y.Tsuboi。;鹿岛,H。;杉山,M。;Kanamori,T.,使用直接密度比估计的统计异常值检测,Knowl。信息系统。,2011年8月26日,309-336
[27] 杉山,M。;南岛中岛。;鹿岛,H。;冯布诺,P.P。;Kawanabe,M.,协变量移位自适应的直接重要性估计,Ann.Inst.Stat.Math。,60, 4, 699-746, (2008) ·Zbl 1294.62069号
[28] 李思源,曾毅,《学习定位相对异常值》,载《亚洲机器学习会议》,2011年,第47-62页。
[29] P.Bodesheim、A.Freytag、E.Rodner、M.Kemmler、J.Denzler,《新颖性检测的内核零空间方法》,收录于:《计算机视觉与模式识别》,2013年,第3374-3381页。
[30] V.Garcia、J.Sanchez、R.Mollineda、R.Alejo和J.Sotoca,《模式分类和学习中的阶级不平衡问题》,收录于:《TAMIDA进展》,第1卷,2007年。
[31] 肖尔科夫,B。;普拉特,J。;泰勒,J。;Smola,A。;Williamson,R.,估计高维分布的支持,神经计算。,13, 7, 1443-1471, (2001) ·Zbl 1009.62029号
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。