王楚毅;帕特里克·布莱尼 高效Lasso优化的自适应混合筛选。 (英语) 兹伯利07551352 J.统计计算。模拟 92,第11号,2233-2256(2022). 摘要:拉索型模型是分析高维数据的常用方法。现代数据集的大小可能非常大,因此开发高效的算法非常重要。事实证明,特征筛选技术在提高效率方面是有效的,因为它们允许在优化过程中大幅降低维数。在本文中,我们开发了一个自适应混合筛选框架,其中沿着参数值的调整路径自适应地进行筛选,如果之前的解决方案不能显著降低维数,则重用这些解决方案以减少繁重的筛选计算。我们重点讨论了标准套索模型和稀疏逻辑模型,但所提出的框架很灵活,可以很容易地扩展到不同类型的套索模型。通过涉及各种模拟和实际数据集的实验,我们表明,自适应混合方法显著优于其他最先进的方法,在最具挑战性的场景中实现了最大的加速。 理学硕士: 62至XX 统计 62J07型 岭回归;收缩估计量 关键词:拉索;特征筛选;安全筛选;解决方案路径;大规模稀疏学习 软件:大套索 PDF格式BibTeX公司 XML格式引用 \textit{C.Wang}和\textit{P.Breheny},J.统计计算。模拟92,No.11,2233--2256(2022;Zbl 07551352) 全文: 内政部 参考文献: [1] Tibshirani,R.,《通过套索进行回归收缩和选择》,J R Statist Soc:Ser B(Methodol),58,1,267-288(1996)·Zbl 0850.62538号 [2] 袁,M。;Lin,Y.,分组变量回归中的模型选择和估计,J R Statist Soc:Ser B(Statist Methodol),68,1,49-67(2006)·兹比尔1141.62030 [3] 邹,H。;Hastie,T.,《通过弹性网进行正则化和变量选择》,J R Statist Soc:Ser B(Statist Methodol),67,2,301-320(2005)·Zbl 1069.62054号 [4] 弗里德曼,J。;哈斯蒂,T。;Höfling,H.,路径坐标优化,Ann Appl Stat,1,2,302-332(2007)·Zbl 1378.90064号 [5] 蒂布希拉尼,R。;Bien,J。;Friedman,J.,套索型问题中丢弃预测因子的强规则,J R Statist Soc Ser B,74,2,245-266(2012)·Zbl 1411.62213号 [6] Qian,J,Du,W,Tanigawa,Y,et al.求解大规模超高维问题中套索的快速灵活算法;2019.生物研究。630079 [7] Ghaoui,LE,Viallon,V,Rabbani,T.拉索和稀疏监督学习问题的安全特征消除;2010年,arXiv:10094219·兹比尔1259.65010 [8] Wang,J,Zhou,J,Wonka,P,et al.通过双多面体投影的拉索筛选规则。Burges CJC、Bottou L、Welling M、Ghahramani Z、Weinberger KQ编辑。神经信息处理系统的进展。纽约州Red Hook:Curran Associates,Inc;2013年,第1070-1078页。 [9] Xiang,ZJ,Ramadge,PJ。基于相关性的快速套索筛选测试。在:国际声学、语音和信号处理会议。IEEE;2012年,第2137-2140页。 [10] Xiang,ZJ,Xu,H,Ramadge,PJ。学习大规模字典上高维数据的稀疏表示。Shawe-TaylorJ、Zemel R、Bartlett P、Pereira F、Weinberger KQ编辑。神经信息处理系统的进展。纽约州Red Hook:Curran Associates,Inc。;2011年,第900-908页。 [11] 曾勇。;Yang,T。;Breheny,P.,用于套索型问题高效优化的混合安全强度规则,计算统计数据分析,153(2021)·兹比尔1510.62313 [12] Zeng,Y,Breheny,P.biglasso包:R中大数据拟合套索模型的记忆和计算效率求解器;2017年,arXiv:170105936。 [13] Lee,H,Battle,A,Raina,R等。高效稀疏编码算法。在Schölkopf B,Platt J,Hoffman T,编辑。神经信息处理系统的进展。马萨诸塞州剑桥:麻省理工学院出版社;2007年,第801-808页。 [14] 范,J。;Lv,J.,超高维特征空间的确定独立筛选,J R Statist Soc Ser B,70,5,849-911(2008)·Zbl 1411.62187号 [15] Wang,J,Zhou,J,Liu,J等。稀疏逻辑回归的安全筛选规则。在Ghahramani Z,Welling M,Cortes C,Lawrence N,Weinberger KQ,编辑。神经信息处理系统的进展。纽约州Red Hook:Curran Associates,Inc。;2014年,第1053-1061页。 [16] Breheny,P。;Huang,J.,带分组预测因子的非凸惩罚线性和logistic回归模型的群下降算法,Stat-Comput,25,2,173-187(2015)·Zbl 1331.62359号 [17] 项,ZJ;王,Y。;拉马奇,PJ。,套索问题的筛选测试,IEEE Trans-Pattern Ana Mach Intell,39,5,1008-1027(2016) [18] 达斯,S。;福尔,L。;Schönherr,S.,《下一代基因型插补服务和方法》,《自然遗传学》,48,10,1284-1287(2016) 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。