×

一种用成组预测器拟合非凸惩罚广义线性模型的迭代算法。 (英语) Zbl 1255.62209号

摘要:高维数据对统计学习和建模提出了挑战。有时,在需要追求组间稀疏性的地方,可以自然地对预测因子进行分组。共线性可能出现在现实世界中的高维应用中,其中流行的(l_{1})技术既存在选择不一致性,也存在预测不准确性。此外,感兴趣的问题往往超越高斯模型。为了应对这些挑战,本文研究了具有分组预测器的非凸惩罚广义线性模型,并提出了一种简单的计算算法。严格的理论结果保证了其收敛性,并提供了严格的初步缩放。该框架允许分组预测和非凸惩罚,包括离散型惩罚和“(l_{0}+l_{2})”类型惩罚。研究了非凸罚的罚设计和参数调整。超分辨率谱估计在信号处理和癌症分类中的应用以及生物信息学中的联合基因选择表明了非凸惩罚估计的性能提高。

MSC公司:

62J12型 广义线性模型(逻辑模型)
62M15型 随机过程和谱分析的推断
62页第10页 统计学在生物学和医学中的应用;元分析
65C60个 统计中的计算问题(MSC2010)
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Agresti,A.,(分类数据分析。分类数据分析,概率统计中的威利级数(2002),威利国际科学)·Zbl 1018.6202号
[2] Antoniadis,A.,《统计中的小波方法:一些最新发展及其应用》,《统计调查》,第1期,第16-55页(2007年)·兹比尔1300.62028
[3] 布尼亚,F。;Barbu,A.,通过正则化似然优化进行病例对照研究中的降维和变量选择,《电子统计杂志》,31257-1287(2009)·Zbl 1326.62161号
[4] 坎迪斯,E.J。;Tao,T.,线性规划解码,IEEE信息理论汇刊,51,12,4203-4215(2005)·Zbl 1264.94121号
[5] 陈,J。;Chen,Z.,大模型空间模型选择的扩展贝叶斯信息准则,Biometrika,95759-771(2008)·Zbl 1437.62415号
[6] 陈,S。;多诺霍,D。;Saunders,M.,通过基追踪进行原子分解,SIAM科学计算杂志,20,1,33-61(1998)·Zbl 0919.94002号
[7] Chiaretti,S。;李,X。;R先生。;Vitale,A。;Vignetti,M。;Mandelli,F。;Ritz,J。;Foa,R.,成人(t)细胞急性淋巴细胞白血病的基因表达谱确定了对治疗和生存有不同反应的患者的不同亚群,《血液》,103,7,2771-2778(2004)
[8] Daubechies,I。;Defrise,M。;De Mol,C.,具有稀疏约束的线性反问题的迭代阈值算法,《纯粹数学与应用数学通讯》,571413-1457(2004)·Zbl 1077.65055号
[9] Efron,B.,《大规模预测问题的经验贝叶斯估计》,《美国统计协会杂志》,1041015-1028(2009)·Zbl 1388.62009号
[10] 埃夫隆,B。;哈斯蒂,T。;约翰斯通,I。;Tibshirani,R.,最小角回归,《统计年鉴》,32407-499(2004)·Zbl 1091.62054号
[11] 范,J。;Li,R.,《基于非一致惩罚似然的变量选择及其预言性质》,美国统计协会杂志,961348-1360(2001)·Zbl 1073.62547号
[12] 范,J。;Lv,J.,超高维特征空间的确定独立筛选,《皇家统计学会杂志:B辑》,70,5,849-911(2008)·Zbl 1411.62187号
[13] 弗里德曼,J。;哈斯蒂,T。;霍夫林,H。;Tibshirani,R.,路径坐标优化,应用统计年鉴,1302-332(2007)·Zbl 1378.90064号
[14] Friedman,J.、Hastie,T.、Tibshirani,R.,2010a。关于组套索和稀疏组套索的注释。arXiv:1001.0736v1;Friedman,J.、Hastie,T.、Tibshirani,R.,2010a。关于组套索和稀疏组套索的注释。arXiv:1001.0736v1
[15] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,通过坐标下降的广义线性模型的正则化路径,统计软件杂志,33,1(2010)
[16] 高,H.-Y。;Bruce,A.G.,《具有固定收缩的波收缩》,《统计》,第7期,第4期,第855-874页(1997年)·Zbl 1067.62529号
[17] Gasso,G。;阿科托马蒙杰,A。;Canu,S.,用特定非凸惩罚和DC编程系列恢复稀疏信号,IEEE信号处理事务,57,12,4686-4698(2009)·Zbl 1391.90489号
[18] Geman,D。;Reynolds,G.,《约束恢复和不连续恢复,模式分析和机器智能》,IEEE,14,3,367-383(1992)
[19] 冷,C。;Lin,Y。;Wahba,G.,《关于套索和模型选择相关程序的说明》,《中国统计》,16,4,1273-1284(2006)·Zbl 1109.62056号
[20] 肖尔滕斯,D。;von Heydebreck,A.,差异基因表达研究分析,(Gentleman,R.;Carey,V.;Huber,W.;Irizarry,R.);Dudoit,S.,《使用R和生物导体的生物信息学和计算生物学解决方案》(2005),斯普林格出版社,229-248
[21] She,Y.,基于阈值的模型选择和收缩迭代选择程序,《电子统计杂志》,3384-415(2009)·Zbl 1326.62158号
[22] She,Y.,《稀疏回归与精确聚类》,《电子统计杂志》,41055-1096(2010)·Zbl 1329.62327号
[23] 她,Y。;Owen,A.B.,使用非凸惩罚回归进行离群值检测,《美国统计协会杂志》,106,494,626-639(2011)·Zbl 1232.62068号
[24] Tibshirani,R.,《通过套索进行回归收缩和选择》,《皇家统计学会期刊:B辑》,58267-288(1996)·Zbl 0850.62538号
[25] Tibshirani,R。;哈斯蒂,T。;Narashiman,B。;Chu,G.,通过基因表达的收缩质心诊断多种癌症,美国国家科学院学报,996567-6572(2002)
[26] 袁,M。;Lin,Y.,《分组变量回归中的模型选择和估计》,《皇家统计学会杂志:B辑》,68,49-67(2006)·Zbl 1141.62030号
[27] Zhang,T.,带l1正则化的最小二乘回归的一些尖锐性能界限,《统计年鉴》,372109-2144(2009)·Zbl 1173.62029号
[28] Zhang,C.-H.,最小最大凹惩罚下的几乎无偏变量选择,统计年鉴,38,2,894-942(2010)·Zbl 1183.62120号
[29] 张,C.-H。;Huang,J.,高维线性回归中拉索选择的稀疏性和偏差,《统计年鉴》,361567-1594(2008)·Zbl 1142.62044号
[30] 赵,P。;Yu,B.,关于套索的模型选择一致性,《机器学习研究杂志》,7,2541-2563(2006)·Zbl 1222.62008年
[31] 邹,H。;Hastie,T.,《通过弹性网进行正则化和变量选择》,《皇家统计学会杂志:B辑》,67,2,301-320(2005)·Zbl 1069.62054号
[32] 邹,H。;Li,R.,非冲突惩罚似然模型中的一步稀疏估计,统计年鉴,36,4,1509-1533(2008)·Zbl 1142.62027号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。