×

使用离散优化联合异常值检测和变量选择。 (英语) Zbl 1472.62110号

小结:在回归中,估计量的质量对虚假变量和异常值的存在非常敏感。不幸的是,在处理真实数据时,这是一种常见的情况。为了处理离群倾向并实现变量选择,我们提出了一种稳健的方法,在选择相关变量的同时彻底拒绝不一致的观测值。定义相应优化问题的一种自然方法是使用\(\ell_0\)范数并将其重构为混合整数优化问题。为了更有效地检索此全局解决方案,我们建议使用附加约束以及巧妙的初始化。为此,引入了一种高效且可扩展的非凸近端交替算法。还对(ell0)范数方法及其松弛进行了实证比较。在合成和实际数据集上的结果表明,混合整数规划方法及其离散一阶温启动提供了高质量的解决方案。

理学硕士:

62J05型 线性回归;混合模型
62J20型 诊断、线性推理和回归
62J07型 岭回归;收缩估计器(拉索)
62G35型 非参数稳健性
90立方厘米 混合整数编程
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Alfons,A.、Croux,C.和Gelper,S.等人(2013年)。用于分析高维大数据集的稀疏最小二乘回归。应用统计年鉴,7226-248·Zbl 1454.62123号
[2] Bertsimas,D.、King,A.和Mazumder,R.(2015)。通过现代优化透镜选择最佳子集。《统计年鉴》,472324-2354·Zbl 1335.62115号
[3] Bolt,J.、Sabach,S.和Teboulle,M.(2014)。非凸和非光滑问题的近端交替线性化极小化。数学编程,146,459-494·Zbl 1297.90125号
[4] Campos,G.O.、Zimek,A.、Sander,J.、Campello,R.J.、Micenkov´A,B.、Schubert,E.、Assent,I.和Houle,M.E.(2016)。非监督异常值检测的评估:测量、数据集和实证研究。数据挖掘和知识发现,30891-927。
[5] Chen,Y.、Caramanis,C.和Mannor,S.(2013)。对抗性腐败下的稳健稀疏回归。在机器学习国际会议上,第774-782页。
[6] Dalalyan,A.S.和Thompson,P.(2019年)。稀疏线性模型的Outlier-ro-bast估计1被处罚的huber'sm-eestimator.arXiv预印本arXiv:1904.06288。
[7] Giloni,A.和Padberg,M.(2002年)。最小二乘回归、最小二乘回归和数学规划。数学与计算机建模,351043-1060·Zbl 1106.62340号
[8] Hastie,T.、Tibshirani,R.和Tibshilani,R.J.(2017)。最佳子集选择、正向逐步选择和lasso.arXiv预印本arXiv:1707.08692的扩展比较·Zbl 07307187号
[9] Hodge,V.和Austin,J.(2004)。离群值检测方法综述。人工智能评论,22,85-126·Zbl 1101.68023号
[10] Miller,A.(2002年)。回归中的子集选择。CRC出版社·Zbl 1051.62060号
[11] Miyashiro,R.和Takano,Y.(2015)。mallows的子集选择:一种混合整数编程方法。应用专家系统,42,325-331。
[12] Nguyen,N.H.和Tran,T.D.(2013)。坚固的套索,有缺失和严重损坏的观测结果。IEEE信息理论事务,592036-2058·Zbl 1364.94146号
[13] Ollerer,V.、Alfons,A.和Croux,C.(2016)。稳健回归的打靶s估计。¨计算统计,31829-844·Zbl 1347.65027号
[14] Parikh,N.和Boyd,S.P.(2014年)。近似算法。优化的基础和趋势,1127-239。
[15] Rousseeuw,P.J.和Hubert,M.(2018年)。通过稳健统计进行异常检测。威利跨学科评论:数据挖掘和知识发现,8,e1236。
[16] Rousseeuw,P.J.和Leroy,A.M.(1987)。稳健回归和异常检测,第589卷。约翰·威利父子公司·兹比尔0711.62030
[17] She,Y.和Owen,A.B.(2011年)。使用非凸惩罚回归进行异常检测。美国统计协会杂志,106626-639·Zbl 1232.62068号
[18] Tibshirani,R.(1996)。通过套索回归收缩和选择。英国皇家统计学会杂志:B辑(方法学),58267-288·Zbl 0850.62538号
[19] Tibshirani,R.、Wainwright,M.和Hastie,T.(2015)。稀疏的统计学习:套索和泛化。查普曼和霍尔/CRC·Zbl 1319.68003号
[20] Wang,H.,Li,G.和Jiang,G..(2007年)。稳健的回归收缩和通过lad-lasso的一致变量选择。《商业与经济统计杂志》,25447-355。
[21] Yang,M.、Xu,L.、White,M.,Schuurmans,D.和Yu,Y.-L.(2010)。松弛裁剪:稳健回归和分类的全局训练方法。神经信息处理系统进展,第2532-2540页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。