×

拉索问题和唯一性。 (英语) Zbl 1337.62173号

摘要:套索是稀疏线性回归的常用工具,特别是对于变量数(p)超过观察数(n)的问题。但当(p>n)时,拉索准则不是严格凸的,因此它可能没有唯一的极小值。一个重要的问题是:套索解何时定义明确(唯一)?我们回顾了文献中的结果,其中表明,如果预测变量是从连续概率分布中提取的,那么无论大小为\(n)和\(p),都存在概率为1的唯一拉索解。我们还表明,这个结果很容易推广到广泛损失函数上的(ell_{1})惩罚最小化问题。
第二个重要问题是:我们如何管理套索解的非唯一性?根据上述结果,只有当某些预测变量是离散的,或者对连续的预测测量值进行了一些后处理时,才会出现这种情况。虽然我们当然不能声称对这样一个广泛的问题提供了一个完整的答案,但我们确实在理解非独特性的某些方面取得了进展。首先,我们扩展了计算套索解路径的LARS算法,以覆盖非唯一情况,使该路径算法适用于任何预测矩阵。接下来,我们基于线性规划推导了一种简单的方法,用于计算任何给定问题实例的套索解中的分量不确定性。最后,我们回顾了文献中关于套索解的一些统一性质的结果,并指出了具有不同性质的解的特殊形式。

MSC公司:

62J07型 岭回归;收缩估计器(拉索)
62J05型 线性回归;混合模型
65C60个 统计中的计算问题(MSC2010)

软件:

PDCO公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bickel,P.、Ritov,Y.和Tsybakov,A.(2009),“套索和丹齐格选择器的同时分析”,《统计年鉴》37(4),1705-1732·兹比尔1173.62022 ·doi:10.1214/08-AOS620
[2] Candes,E.J.和Plan,Y.(2009),“通过(ell_{1})最小化进行近理想模型选择”,《统计年鉴》37(5),2145-2177·Zbl 1173.62053号 ·doi:10.1214/08-AOS653
[3] Chen,S.、Donoho,D.L.和Saunders,M.(1998),“基追踪的原子分解”,SIAM科学计算杂志20(1),33-61·Zbl 0919.94002号 ·doi:10.1137/S1064827596304010
[4] Donoho,D.L.(2006),“对于大多数大型欠定线性方程组,最小解也是最稀疏解”,《纯粹与应用数学通讯》59(6),797-829·Zbl 1113.15004号 ·doi:10.1002/cpa.20132年
[5] Dossal,C.(2012),“通过\(\ell_{1}\)最小化进行精确稀疏恢复的充要条件”,Comptes Rendus Mathematique 350(1-2),117-120·Zbl 1236.94028号
[6] Efron,B.、Hastie,T.、Johnstone,I.和Tibshirani,R.(2004),“最小角度回归”,《统计年鉴》32(2),407-499·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[7] Fuchs,J.J.(2005),“有界噪声存在下精确稀疏表示的恢复”,IEEE信息理论汇刊51(10),3601-3608·Zbl 1286.94031号
[8] Fukuda,K.,Liebling,T.M.和Margot,F.(1997),“列出凸多面体所有顶点和所有面的回溯算法分析”,计算几何:理论与应用8(1),1-12·Zbl 1133.68462号 ·doi:10.1016/0925-7721(95)00049-6
[9] Koltchinskii,V.(2009年a),“Dantzig选择器和稀疏预言不等式”,Bernoulli 15(3),799-828·Zbl 1452.62486号
[10] Koltchinskii,V.(2009年b),“惩罚经验风险最小化中的稀疏性”,《亨利·庞加莱研究所年鉴》,概率与统计45(1),7-57·Zbl 1168.62044号 ·doi:10.1214/07-AIHP146
[11] Mairal,J.和Yu,B.(2012),“套索正则化路径的复杂性分析”,《机器学习国际会议论文集》29。
[12] Negahban,S.、Ravikumar,P.、Wainwright,M.J.和Yu,B.(2012),带可分解正则化子的高维估计量分析的统一框架。出现在《统计科学》杂志上·Zbl 1331.62350号
[13] Osborne,M.、Presnell,B.和Turlach,B.(2000年a),“最小二乘问题中变量选择的新方法”,IMA数值分析杂志20(3),389-404·Zbl 0962.65036号 ·doi:10.1093/imanum/20.3.89
[14] Osborne,M.、Presnell,B.和Turlach,B.(2000年B),“套索及其对偶”,《计算与图形统计杂志》9(2),319-337。
[15] Rockafellar,R.T.(1970),凸分析,普林斯顿大学出版社,普林斯顿·Zbl 0193.18401号
[16] Rosset,S.、Zhu,J.和Hastie,T.(2004),“作为最大边界分类器的正则化路径进行提升”,《机器学习研究杂志》,第5期,941-973页·Zbl 1222.68290号
[17] Tibshirani,R.(1996),“通过套索进行回归收缩和选择”,《皇家统计学会杂志:B系列58(1)》,267-288·Zbl 0850.62538号
[18] Tibshirani,R.J.(2011),《广义拉索解的路径》,斯坦福大学统计系博士论文·Zbl 1234.62107号
[19] Tibshirani,R.J.和Taylor,J.(2011),“广义套索的解算路径”的证明和技术细节·Zbl 1234.62107号
[20] Tibshirani,R.J.和Taylor,J.(2012),“套索问题的自由度”,《统计年鉴》40(2),1198-1232·Zbl 1274.62469号
[21] van de Geer,S.和Buhlmann,P.(2009),“关于证明套索预言结果的条件”,《电子统计杂志》,第3期,1360-1392页·Zbl 1327.62425号
[22] Wainwright,M.J.(2009),“使用\(\ell_{1}\)约束二次规划(lasso)进行高维和噪声稀疏性恢复的尖锐阈值”,IEEE信息理论汇刊55(5),2183-2202·Zbl 1367.62220号
[23] Zhao,P.和Yu,B.(2006),“套索模型选择一致性研究”,《机器学习研究杂志》7,2541-2564·Zbl 1222.62008年
[24] Zou,H.和Hastie,T.(2005),“通过弹性网的正则化和变量选择”,英国皇家统计学会期刊:B系列67(2),301-320·Zbl 1069.62054号 ·数字对象标识代码:10.1111/j.1467-9868.2005.0050.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。