×

高效Lasso优化的自适应混合筛选。 (英语) 兹伯利07551352

摘要:拉索型模型是分析高维数据的常用方法。现代数据集的大小可能非常大,因此开发高效的算法非常重要。事实证明,特征筛选技术在提高效率方面是有效的,因为它们允许在优化过程中大幅降低维数。在本文中,我们开发了一个自适应混合筛选框架,其中沿着参数值的调整路径自适应地进行筛选,如果之前的解决方案不能显著降低维数,则重用这些解决方案以减少繁重的筛选计算。我们重点讨论了标准套索模型和稀疏逻辑模型,但所提出的框架很灵活,可以很容易地扩展到不同类型的套索模型。通过涉及各种模拟和实际数据集的实验,我们表明,自适应混合方法显著优于其他最先进的方法,在最具挑战性的场景中实现了最大的加速。

理学硕士:

62至XX 统计
62J07型 岭回归;收缩估计量

软件:

大套索
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Tibshirani,R.,《通过套索进行回归收缩和选择》,J R Statist Soc:Ser B(Methodol),58,1,267-288(1996)·Zbl 0850.62538号
[2] 袁,M。;Lin,Y.,分组变量回归中的模型选择和估计,J R Statist Soc:Ser B(Statist Methodol),68,1,49-67(2006)·兹比尔1141.62030
[3] 邹,H。;Hastie,T.,《通过弹性网进行正则化和变量选择》,J R Statist Soc:Ser B(Statist Methodol),67,2,301-320(2005)·Zbl 1069.62054号
[4] 弗里德曼,J。;哈斯蒂,T。;Höfling,H.,路径坐标优化,Ann Appl Stat,1,2,302-332(2007)·Zbl 1378.90064号
[5] 蒂布希拉尼,R。;Bien,J。;Friedman,J.,套索型问题中丢弃预测因子的强规则,J R Statist Soc Ser B,74,2,245-266(2012)·Zbl 1411.62213号
[6] Qian,J,Du,W,Tanigawa,Y,et al.求解大规模超高维问题中套索的快速灵活算法;2019.生物研究。630079
[7] Ghaoui,LE,Viallon,V,Rabbani,T.拉索和稀疏监督学习问题的安全特征消除;2010年,arXiv:10094219·兹比尔1259.65010
[8] Wang,J,Zhou,J,Wonka,P,et al.通过双多面体投影的拉索筛选规则。Burges CJC、Bottou L、Welling M、Ghahramani Z、Weinberger KQ编辑。神经信息处理系统的进展。纽约州Red Hook:Curran Associates,Inc;2013年,第1070-1078页。
[9] Xiang,ZJ,Ramadge,PJ。基于相关性的快速套索筛选测试。在:国际声学、语音和信号处理会议。IEEE;2012年,第2137-2140页。
[10] Xiang,ZJ,Xu,H,Ramadge,PJ。学习大规模字典上高维数据的稀疏表示。Shawe-TaylorJ、Zemel R、Bartlett P、Pereira F、Weinberger KQ编辑。神经信息处理系统的进展。纽约州Red Hook:Curran Associates,Inc。;2011年,第900-908页。
[11] 曾勇。;Yang,T。;Breheny,P.,用于套索型问题高效优化的混合安全强度规则,计算统计数据分析,153(2021)·兹比尔1510.62313
[12] Zeng,Y,Breheny,P.biglasso包:R中大数据拟合套索模型的记忆和计算效率求解器;2017年,arXiv:170105936。
[13] Lee,H,Battle,A,Raina,R等。高效稀疏编码算法。在Schölkopf B,Platt J,Hoffman T,编辑。神经信息处理系统的进展。马萨诸塞州剑桥:麻省理工学院出版社;2007年,第801-808页。
[14] 范,J。;Lv,J.,超高维特征空间的确定独立筛选,J R Statist Soc Ser B,70,5,849-911(2008)·Zbl 1411.62187号
[15] Wang,J,Zhou,J,Liu,J等。稀疏逻辑回归的安全筛选规则。在Ghahramani Z,Welling M,Cortes C,Lawrence N,Weinberger KQ,编辑。神经信息处理系统的进展。纽约州Red Hook:Curran Associates,Inc。;2014年,第1053-1061页。
[16] Breheny,P。;Huang,J.,带分组预测因子的非凸惩罚线性和logistic回归模型的群下降算法,Stat-Comput,25,2,173-187(2015)·Zbl 1331.62359号
[17] 项,ZJ;王,Y。;拉马奇,PJ。,套索问题的筛选测试,IEEE Trans-Pattern Ana Mach Intell,39,5,1008-1027(2016)
[18] 达斯,S。;福尔,L。;Schönherr,S.,《下一代基因型插补服务和方法》,《自然遗传学》,48,10,1284-1287(2016)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。