×

通过凸集分解实现稀疏群Lasso的两层特征约简。 (英文) Zbl 1446.62207号

摘要:稀疏群Lasso(SGL)被证明是一种强大的回归技术,可以通过使用\(ell_1)和\(ell_2)范数的组合来同时发现群稀疏模式和群内稀疏模式。然而,在大规模应用中,正则化子的复杂性带来了巨大的计算挑战。本文通过对SGL的对偶可行集进行分解,提出了一种新的两层特征约简方法(TLFre)。两层约简能够分别快速识别非活动组和非活动特征,这些特征保证不会出现在稀疏表示中,并且可以从优化中删除。现有的特征约简方法仅适用于具有一个稀疏诱导正则化子的稀疏模型。据我们所知,TLFre是第一个能够处理多个稀疏诱导正则化子的正则化子。此外,TLFre具有非常低的计算成本,可以与任何现有解算器集成。我们还为非负Lasso开发了一种筛选方法,称为DPC(凸集分解)。在合成数据集和实际数据集上的实验表明,TLFre和DPC将SGL和非负Lasso的效率提高了几个数量级。

MSC公司:

62J07型 山脊回归;收缩估计器(拉索)
52A20型 维的凸集(包括凸超曲面)
62页第10页 统计学在生物学和医学科学中的应用;元分析
PDF格式BibTeX公司 XML格式引用
全文: arXiv公司 链接

参考文献:

[1] S.Armstrong、J.Staunton、L.Silverman、R.Pieters、M.den Boer、M.Minden、S.Sallan、E.Lander、T.Golub和S.Korsmeyer。MLL易位指定了一个独特的基因表达谱,以区分独特的白血病。《自然遗传学》,30:41-472002。
[2] H.H.Bauschke和P.L.Combettes。Hilbert空间中的凸分析和单调算子理论。施普林格,2011年·Zbl 1218.47001号
[3] J.Borwein和A.Lewis。凸分析与非线性优化,第二版。加拿大数学学会,2006年·Zbl 1116.90001号
[4] S.Boyd和L.Vandenberghe。凸优化。剑桥大学出版社,2004年·Zbl 1058.90049号
[5] D.Cai、X.He和J.Han。通过谱回归进行有效的核判别分析。ICDM,2007年。
[6] 张志忠和林志仁。Libsvm:支持向量机库。ACM关于智能系统和技术的交易(TIST),2(3):2011年7月27日。
[7] L.El Ghaoui、V.Viallon和T.Rabbani。稀疏监督学习中的安全特征消除。太平洋优化杂志,8:667-6982012·Zbl 1259.65010号
[8] O Fercoq和P Richtrik。加速、平行和近距离坐标下降。优化杂志,2013,25(4),2013。
[9] J.Friedman、T.Hastie和R.Tibshirani。关于组套索和稀疏组套索的注释。arXiv:1001.0736。
[10] N.Halko、P.Martinsson和J.Tropp。寻找具有随机性的结构:用于构造近似矩阵分解的概率算法。《SIAM评论》,53:217-2882011年·兹比尔1269.65043
[11] J.-B.Hiriart-Urruti。从凸优化到非凸优化。全局最优的充要条件。在非平滑优化和相关主题中。斯普林格,1988年。
[12] J.-B.Hiriart-Urruti。关于凸复合函数的Legendre-Fincel变换的注记。非光滑力学与分析。斯普林格,2006年。
[13] Y.Lecun、L.Bottou、Y.Bengio和P.Haffner。基于梯度的学习应用于文档识别。1998年IEEE会议记录。
[14] 林启航、陆兆松、林晓。加速近似坐标梯度法及其在正则化经验风险最小化中的应用。SIAM优化杂志,25(4):52-582014·Zbl 1329.65127号
[15] J.Liu和J.Ye.分组树结构学习的Moreau-Yosida正则化。《神经信息处理系统进展》2010年第23期。
[16] 基于凸集分解的稀疏群Lasso的两层特征约简·Zbl 1446.62207号
[17] J.Liu、S.Ji和J.Ye.SLEP:稀疏学习与有效投射。亚利桑那州立大学,2009年。
[18] 刘J.,Z.Zhao,J.Wang,J.Ye。变分不等式的安全筛选及其在套索中的应用。2014年国际机器学习会议。
[19] Y.Netzer、T.Wang、A.Coates、A.Bissacco、B.Wu和A.Ng。使用无监督特征学习读取自然图像中的数字。InNIPS深度学习和无监督特征学习研讨会,2001年。
[20] 小川、铃木和竹内。路径支持向量机计算中非支持向量的安全筛选。2013年国际机器学习会议。
[21] 小川、铃木、铃木和竹内。支持向量机的安全样本筛选。arXiv:1401.67402014。
[22] J.Peng、J.Zhu、A.Bergamaschi、W.Han、D.Noh、J.Pollack和P.Wang。正则多元回归用于识别主预测因子,并应用于乳腺癌的综合基因组学研究。应用统计年鉴,4:53-772010·Zbl 1189.62174号
[23] E.Petricoin、D.Ornstein、C.Paweletz、A.Ardekani、P.Hackett、B.Hitt、A.Velassco、C.Trucco、L.Wiegand、K.Wood、C.Simone、P.Levine、W.Linehan、M.Emmert-Buck、S.Steinberg、E.Kohn和L.Liotta。前列腺癌检测的血清蛋白质组模式。国家癌症研究所杂志,94:1576-15782002。
[24] A.Ruszczy´nski。非线性优化。普林斯顿大学出版社,2006年·Zbl 1108.90001号
[25] S.Shevade和S.Keerthi。一种使用稀疏逻辑回归进行基因选择的简单高效算法。生物信息学,19:2246-22532003。
[26] T.Sim、B.Baker和M.Bsat。CMU姿势、照明和表达式数据库。IEEE模式分析和机器智能汇刊,25:1615-16182003。
[27] N.Simon,J.Friedman。,T.哈斯蒂。,和R.Tibshirani。稀疏型套索。《计算与图形统计杂志》,22:231-2452013年。
[28] P.Sprechmann、I.Ram´ónf rez、G.Sapiro、。,和Y.Eldar。C-HiLasso:一个协作层次化稀疏建模框架。《信号处理EEE汇刊》,59:4183-41982011年·Zbl 1392.94467号
[29] R.Tibshirani。通过套索进行回归尖叫和选择。《皇家统计学会期刊B辑》,58:267-2881996年·Zbl 0850.62538号
[30] R.Tibshirani、J.Bien、J.Friedman、T.Hastie、N.Simon、J.Taylor和R.Tibbhirani。在套索型问题中丢弃预测因子的强规则。《皇家统计学会期刊B辑》,74:245-2662012年·Zbl 1411.62213号
[31] 罗伯特·蒂布西拉尼、马丁·温赖特和特雷弗·哈斯蒂。稀疏性的统计学习:拉索和推广。查普曼和霍尔/CRC,2015年·兹比尔1319.68003
[32] M.维迪亚萨加。癌症协同计算生物学中的机器学习方法。《英国皇家学会学报A》,2014年·Zbl 1371.92005年
[33] M.Vincent和N.Hansen。稀疏群套索和高维多项式分类。计算统计与数据分析,71:771-7862014·Zbl 1471.62200号
[34] 王勇军,叶坚。高效混合形式正则化:算法和安全筛选方法。arXiv:1307.4156v1。
[35] J.Wang、J.Zhou、P.Wonka和J.Ye。拉索通过双多面体投影筛选规则。神经信息处理系统进展,2013年26月。
[36] J.Wang、P.Wonka和J.Ye。通过精确数据缩减缩放支持向量机和最小绝对偏差。2014年国际机器学习会议。
[37] M.West、C.Blanchette、H.Dressman、E.Huang、S.Ishida、R.Spang、H.Zuzan、J.Olson、J.Marks和J.Nevins。利用基因表达谱预测人类乳腺癌的临床状况。《美国国家科学院院刊》,98:11462-114672001年。
[38] Z.J.Xiang和P.J.Ramadge。基于相关性的快速套索筛选测试。在IEEE ICASSP中,2012年。
[39] D.Yogatama和N.Smith。文本分类中的语言结构稀疏性。2014年计算语言学协会年会论文集。
[40] M.Yuan和Y.Lin。分组变量回归中的模型选择和估计。英国皇家统计学会期刊B辑,68:49-672006·兹比尔1141.62030
[41] Y.J.Zhang、N.Zhanng、D.F.Sun和K.C.Toh。一种求解大规模稀疏群套索问题的高效hessian算法。数学规划,2018a·Zbl 1435.90112号
[42] Y.J.Zhang、N.Zhanng、D.F.Sun和K.C.Toh。一种求解大规模稀疏群套索问题的高效hessian算法。数学规划,2018b·Zbl 1435.90112号
[43] H。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。