卢卡斯·迈耶;萨拉·范德格尔;彼得·伯尔曼 拉索组用于逻辑回归。 (英语) Zbl 1400.62276号 J.R.Stat.Soc.,塞尔维亚。B、 统计方法。 70,第1号,53-71(2008). 摘要:组套索是套索的扩展,用于在线性回归模型中对(预定义的)变量组进行变量选择。这些估计在分组正交重参数化下具有不变性。我们将群套索推广到logistic回归模型,并提出了一种有效的算法,该算法特别适用于高维问题,也可以应用于广义线性模型,以解决相应的凸优化问题。即使预测因子的数量远大于样本量,但具有稀疏的真实基础结构,逻辑回归的群Lasso估计量也被证明是统计一致的。我们进一步使用了一个两阶段程序,其目标是比组套索更稀疏的模型,从而在某些情况下提高了预测性能。此外,由于两阶段的性质,可以将估计值构建为层次结构。这些方法用于DNA序列中剪接位点检测的模拟和实际数据集。 引用于262文件 MSC公司: 62页第10页 统计学在生物学和医学中的应用;元分析 关键词:分类数据;坐标下降算法;DNA剪接位点;组变量选择;高维广义线性模型;惩罚可能性 软件:备用日志记录 PDF格式BibTeX公司 XML格式引用 \textit{L.Meier}等人,J.R.Stat.Soc.,Ser。B、 统计方法。70,编号1,53--71(2008;Zbl 1400.62276) 全文: 内政部 参考文献: [1] 安东尼亚迪斯,小波近似的正则化(讨论),美国统计学家J。资产负债表96第939页–(2001年)·Zbl 1072.62561号 [2] Bakin,S.1999数据挖掘问题中的自适应回归和模型选择博士论文澳大利亚国立大学 [3] Balakrishnan,S.Madigan,D.2006罗格斯大学海量数据环境下稀疏线性分类器的算法http://www.stat.rutgers.edu/madigan/纸张/·Zbl 1225.68148号 [4] Bertsekas,非线性规划(2003) [5] Burge,分子生物学中的计算方法,第129页–(1998) [6] Burge,《人类基因组DNA中完整基因结构的预测》,J.Molec。生物.268第78页–(1997) [7] 蔡,讨论“小波近似的正则化”(A.Antoniadis和J.Fan),J.Am.Statist。资产负债表96第960页–(2001年) [8] Efron,最小角回归,Ann.Statist。第32页,407页–(2004年)·兹比尔1091.62054 [9] Van De Geer,非参数统计的最新进展和趋势,第235页–(2003) [10] Van De Geer,高维广义线性模型和套索,Ann.Statist。(2007) ·Zbl 1138.62323号 [11] Genkin,文本分类的大尺度贝叶斯逻辑回归49 pp 291–(2007) [12] Kim,分块稀疏回归,统计师。罪。第16页,375页–(2006年)·Zbl 1096.62076号 [13] 金,罕见事件数据的Logistic回归,《政治分析》。第137页第9页–(2001年)·doi:10.1093/oxfordjournals.pan.a004868 [14] Krishnapuram,稀疏多项式逻辑回归:快速算法和泛化界限,IEEE Trans。Pattn Ana公司。机器。智力。第27页,957页–(2005年) [15] Lokhorst,J.1999阿德莱德大学荣誉项目套索和广义线性模型 [16] Meinshausen,Lasso with relaxation,计算机统计。数据分析。52第374页–(2007年) [17] Osborne,最小二乘问题中变量选择的新方法,IMA J.Numer。分析。第20页,389页–(2000年)·Zbl 0962.65036号 [18] Park,检测基因相互作用的正则化路径算法(2006) [19] Park,广义线性模型的L1正则化路径算法,J.R.Statist。Soc.B 69第659页–(2007年) [20] Rosset,神经信息处理系统进展,第1153页–(2005) [21] 罗斯,广义套索,IEEE Trans。诺尔。Netwrks 15 pp 16–(2004) [22] Shevade,《使用稀疏逻辑回归进行基因选择的简单高效算法》,《生物信息学》第19卷第2246页–(2003年) [23] Tarigan,具有l1复杂性正则化的支持向量机类型分类器,Bernoulli 12 pp 1045–(2006)·Zbl 1118.62067号 [24] Tibshirani,《通过套索进行回归收缩和选择》,J.R.Statist。Soc.B 58第267页–(1996年)·Zbl 0850.62538号 [25] Tibshirani,考克斯模型中变量选择的套索方法,统计学家。《医学杂志》第16卷第385页–(1997年) [26] 曾,不可微极小化块坐标下降法的收敛性,J.Optimizn理论应用。第109页,第475页–(2001年) [27] Tseng,非光滑可分离极小化的坐标梯度下降法(2007)·兹比尔1166.90016 [28] Yeo,短序列模体的最大熵建模及其在RNA剪接信号中的应用,《计算机生物学杂志》。第11页,第475页–(2004年) [29] 袁,分组变量回归中的模型选择和估计,J.R.Statist。Soc.B 68第49页–(2006年)·Zbl 1141.62030号 [30] 赵,舞台套索(2007) 此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。