文件Zbl 1472.62110-zbMATH打开

使用离散优化联合异常值检测和变量选择。（英语） Zbl 1472.62110号

分拣 45，编号1，47-66（2021）.

小结：在回归中，估计量的质量对虚假变量和异常值的存在非常敏感。不幸的是，在处理真实数据时，这是一种常见的情况。为了处理离群倾向并实现变量选择，我们提出了一种稳健的方法，在选择相关变量的同时彻底拒绝不一致的观测值。定义相应优化问题的一种自然方法是使用\（\ell_0\）范数并将其重构为混合整数优化问题。为了更有效地检索此全局解决方案，我们建议使用附加约束以及巧妙的初始化。为此，引入了一种高效且可扩展的非凸近端交替算法。还对（ell0）范数方法及其松弛进行了实证比较。在合成和实际数据集上的结果表明，混合整数规划方法及其离散一阶温启动提供了高质量的解决方案。

理学硕士：

62J05型	线性回归；混合模型
62J20型	诊断、线性推理和回归
62J07型	岭回归；收缩估计器（拉索）
62G35型	非参数稳健性
90立方厘米	混合整数编程
68T05型	人工智能中的学习和自适应系统

关键词：

稳健优化;统计学学习;线性回归;变量选择;异常检测;混合整数规划

PDF格式 BibTeX公司 XML格式引用

全文：内政部

参考文献：

[1]	Alfons，A.、Croux，C.和Gelper，S.等人（2013年）。用于分析高维大数据集的稀疏最小二乘回归。应用统计年鉴，7226-248·Zbl 1454.62123号
[2]	Bertsimas，D.、King，A.和Mazumder，R.（2015）。通过现代优化透镜选择最佳子集。《统计年鉴》，472324-2354·Zbl 1335.62115号
[3]	Bolt，J.、Sabach，S.和Teboulle，M.（2014）。非凸和非光滑问题的近端交替线性化极小化。数学编程，146，459-494·Zbl 1297.90125号
[4]	Campos，G.O.、Zimek，A.、Sander，J.、Campello，R.J.、Micenkov´A，B.、Schubert，E.、Assent，I.和Houle，M.E.（2016）。非监督异常值检测的评估：测量、数据集和实证研究。数据挖掘和知识发现，30891-927。
[5]	Chen，Y.、Caramanis，C.和Mannor，S.（2013）。对抗性腐败下的稳健稀疏回归。在机器学习国际会议上，第774-782页。
[6]	Dalalyan，A.S.和Thompson，P.（2019年）。稀疏线性模型的Outlier-ro-bast估计ℓ1被处罚的huber'sm-eestimator.arXiv预印本arXiv:1904.06288。
[7]	Giloni，A.和Padberg，M.（2002年）。最小二乘回归、最小二乘回归和数学规划。数学与计算机建模，351043-1060·Zbl 1106.62340号
[8]	Hastie，T.、Tibshirani，R.和Tibshilani，R.J.（2017）。最佳子集选择、正向逐步选择和lasso.arXiv预印本arXiv:1707.08692的扩展比较·Zbl 07307187号
[9]	Hodge，V.和Austin，J.（2004）。离群值检测方法综述。人工智能评论，22，85-126·Zbl 1101.68023号
[10]	Miller，A.（2002年）。回归中的子集选择。CRC出版社·Zbl 1051.62060号
[11]	Miyashiro，R.和Takano，Y.（2015）。mallows的子集选择：一种混合整数编程方法。应用专家系统，42，325-331。
[12]	Nguyen，N.H.和Tran，T.D.（2013）。坚固的套索，有缺失和严重损坏的观测结果。IEEE信息理论事务，592036-2058·Zbl 1364.94146号
[13]	Ollerer，V.、Alfons，A.和Croux，C.（2016）。稳健回归的打靶s估计。¨计算统计，31829-844·Zbl 1347.65027号
[14]	Parikh，N.和Boyd，S.P.（2014年）。近似算法。优化的基础和趋势，1127-239。
[15]	Rousseeuw，P.J.和Hubert，M.（2018年）。通过稳健统计进行异常检测。威利跨学科评论：数据挖掘和知识发现，8，e1236。
[16]	Rousseeuw，P.J.和Leroy，A.M.（1987）。稳健回归和异常检测，第589卷。约翰·威利父子公司·兹比尔0711.62030
[17]	She，Y.和Owen，A.B.（2011年）。使用非凸惩罚回归进行异常检测。美国统计协会杂志，106626-639·Zbl 1232.62068号
[18]	Tibshirani，R.（1996）。通过套索回归收缩和选择。英国皇家统计学会杂志：B辑（方法学），58267-288·Zbl 0850.62538号
[19]	Tibshirani，R.、Wainwright，M.和Hastie，T.（2015）。稀疏的统计学习：套索和泛化。查普曼和霍尔/CRC·Zbl 1319.68003号
[20]	Wang，H.，Li，G.和Jiang，G..（2007年）。稳健的回归收缩和通过lad-lasso的一致变量选择。《商业与经济统计杂志》，25447-355。
[21]	Yang，M.、Xu，L.、White，M.，Schuurmans，D.和Yu，Y.-L.（2010）。松弛裁剪：稳健回归和分类的全局训练方法。神经信息处理系统进展，第2532-2540页

此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配，可能包含数据转换错误。在某些情况下，zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献，而不要求完整或完全匹配。

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
拉	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
数据传输时间	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	括号

示例

领域

操作员

使用离散优化联合异常值检测和变量选择。（英语） Zbl 1472.62110号

理学硕士：

关键词：

参考文献：

示例

领域

操作员

使用离散优化联合异常值检测和变量选择。 （英语） Zbl 1472.62110号

理学硕士：

关键词：

参考文献：

使用离散优化联合异常值检测和变量选择。（英语） Zbl 1472.62110号