×

稀疏逻辑回归中的惩罚稳健估计。 (英语) Zbl 1496.62123号

摘要:稀疏协变量在分类和回归问题中经常出现,而变量选择任务通常是人们感兴趣的。众所周知,稀疏统计模型对应于只有少量非零参数的情况,因此,它们比密集模型更容易解释。本文主要研究logistic回归模型,目的是解决回归参数的稳健和惩罚估计。我们引入了一类对非典型数据稳定的逻辑回归参数的惩罚加权\(M\)型估计。我们探讨了不同的惩罚功能,包括所谓的符号惩罚。我们仔细分析了估计量的收敛速度、变量选择能力以及固定和随机惩罚的渐近分布。还提出了一个稳健的交叉验证准则。通过数值研究,我们比较了经典惩罚估计和稳健惩罚估计在不同污染场景下的有限样本性能。通过对实际数据集的分析,可以研究异常值存在时惩罚估计量的稳定性。

MSC公司:

62J12型 广义线性模型(逻辑模型)
62层35 鲁棒性和自适应程序(参数推断)
2012年12月62日 参数估计量的渐近性质

软件:

玻璃制品
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Avella-Medina,M。;Ronchetti,E.,高维广义线性模型中稳健且一致的变量选择,Biometrika,105,31-44(2018)·Zbl 07072391号 ·doi:10.1093/biomet/asx070
[2] 巴苏,A。;戈什,A。;曼达尔,A。;N.马丁。;Pardo,L.,基于最小密度幂散度估计的逻辑回归模型中检验线性假设的Wald型检验统计量,Electr J Stat,11,2741-2772(2017)·Zbl 1366.62052号
[3] Bianco,A。;Martínez,E.,逻辑回归模型中的稳健检验,Comput Stat Data Anal,534095-4105(2009)·兹比尔1454.62016 ·doi:10.1016/j.csda.2009.04.015
[4] Bianco,A。;Yohai,V.,逻辑回归模型中的稳健估计,讲义统计,109,17-34(1996)·Zbl 0839.62030号 ·数字对象标识代码:10.1007/978-1-4612-2380-1_2
[5] Bondell,HD,logistic回归模型的最小距离估计,Biometrika,92724-731(2005)·Zbl 1152.62324号 ·doi:10.1093/biomet/92.3.724
[6] Bondell,HD,有偏抽样模型的特征函数方法,及其在稳健logistic回归中的应用,J Stat Plann Inference,138742-755(2008)·Zbl 1133.62020年 ·doi:10.1016/j.jspi.2007.01.004
[7] 坎通尼,E。;Ronchetti,E.,广义线性模型的稳健推断,美国统计协会杂志,961022-1030(2001)·Zbl 1072.62610号 ·doi:10.1198/016214501753209004
[8] Chi,EC;Scott,DW,《基于最小距离准则的稳健参数分类和变量选择》,J Comput Graph Stat,23,111-128(2014)·doi:10.1080/10618600.2012.737296
[9] 克罗克斯,C。;弗兰德,C。;Haesbroeck,G.,逻辑回归模型中最大似然估计量的分解行为,Stat Probabil Lett,60,377-386(2002)·Zbl 1045.62014号 ·doi:10.1016/S0167-7152(02)00292-4
[10] 克罗克斯,C。;Haesbroeck,G.,为逻辑回归实现Bianco和Yohai估计,《计算统计数据分析》,44,273-295(2003)·Zbl 1429.62317号 ·doi:10.1016/S0167-9473(03)00042-2
[11] 埃夫隆,B。;Hastie,T.,《计算机年龄统计推断》(2016),剑桥:剑桥大学出版社,剑桥·Zbl 1377.62004号 ·doi:10.1017/CBO9781316576533
[12] 埃夫隆,B。;哈斯蒂,T。;约翰斯通,I。;Tibshirani,R.,《最小角回归》,《年鉴统计》,第32期,第407-499页(2004年)·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[13] Esser,E。;Lou,Y。;Xin,J.,一种寻找非负最小二乘问题的结构化稀疏解的方法及其应用,SIAM J Imag Sci,6202010-2046(2013)·Zbl 1282.90239号 ·doi:10.137/13090540X
[14] 范,J。;Li,R.,《基于非凹陷惩罚似然的变量选择及其预言属性》,美国统计协会,96,1348-1360(2001)·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[15] 弗兰克,LE;Friedman,JH,一些化学计量学回归工具的统计视图,技术计量学,35,109-135(1993)·Zbl 0775.62288号 ·doi:10.1080/00401706.1993.10485033
[16] 弗里德曼,J。;哈斯蒂,T。;Tibshirani,R.,用图形套索进行稀疏逆协方差估计,生物统计学,9,432-441(2008)·Zbl 1143.62076号 ·doi:10.1093/生物统计学/kxm045
[17] 哈斯蒂,T。;Tibshirani,R。;Wainwright,M.,《稀疏的统计学习:拉索和概括》(2015),伦敦:查普曼和霍尔出版社,伦敦·Zbl 1319.68003号 ·doi:10.1201/b18401
[18] 霍尔,AE;Kennard,RW,Ridge回归:非正交问题的有偏估计,技术计量学,12,55-67(1970)·Zbl 0202.17205号 ·网址:10.1080/00401706.1970.10488634
[19] K.奈特。;Fu,W.,Lasso型估计量的渐近性,Annals Stat,281356-1378(2000)·Zbl 1105.62357号
[20] Kurnaz,FS;霍夫曼,I。;Filzmoser,P.,高维线性和逻辑回归的稳健和稀疏估计方法,化学计量智能实验室系统,172211-222(2018)·doi:10.1016/j.chemolab.2017.11.017
[21] Meinshausen,N.,Relaxed Lasso,《计算统计数据分析》,52,374-393(2007)·Zbl 1452.62522号 ·doi:10.1016/j.csda.2006.12.019
[22] 奥勒勒,V。;克罗克斯,C。;诺德豪森,K。;Taskinen,S.,《稳健高维精度矩阵估计,现代非参数、稳健和多元方法》,325-350(2015),Cham:Springer,Cham·doi:10.1007/978-3-319-22404-6_19
[23] 帕克,H。;Konishi,S.,通过弹性网络类型正则化和调整参数选择进行稳健逻辑回归建模,J Stat Compute Simul,861450-1461(2016)·Zbl 1510.62323号 ·doi:10.1080/0949655.2015.1073290
[24] 拉希米,Y。;王,C。;董,H。;Lou,Y.,稀疏信号恢复的尺度不变方法,SIAM科学计算杂志,41,3649-3672(2019)·Zbl 1427.94050号 ·doi:10.1137/18M123147X
[25] Smucler,E。;Yohai,VJ,线性回归模型的稳健和稀疏估计,计算统计数据分析,111,116-130(2017)·Zbl 1464.62164号 ·doi:10.1016/j.csda.2017.02.002
[26] 塔尔,G。;缪勒,S。;NC韦伯,《细胞污染下精确矩阵的稳健估计》,《计算统计数据分析》,93,404-420(2016)·Zbl 1468.62192号 ·doi:10.1016/j.csda.2015.02.005
[27] Tibshirani J,Manning CD(2013),使用移位参数的稳健Logistic回归。摘自:计算语言学协会第52届年会会议记录,第124-129页
[28] Tibshirani,R.,通过套索回归收缩和选择。英国皇家统计学会杂志,B辑(方法学),58267-288(1996)·Zbl 0850.62538号 ·doi:10.1111/j.2517-6161.1996.tb02080.x
[29] van de Geer,S。;Müller,P.,《高维拟似然和/或稳健估计》,《统计科学》,第27期,第469-480页(2012年)·Zbl 1331.62354号
[30] 王,C。;Yan,M。;Rahimi,Y。;Lou,Y.,(L_1/L_2)最小化的加速方案,IEEE Trans Signal Process,68,2660-2669(2020)·Zbl 07590919号 ·doi:10.1109/TSP.2020.2985298
[31] 王,F。;穆克吉,S。;理查森,S。;Hill,S.,《实践中的高维回归:有限样本预测、变量选择和排序的实证研究》,《统计计算》,30,697-719(2020)·Zbl 1437.62151号 ·doi:10.1007/s11222-019-09914-9
[32] Zhang,CH,最小最大凹惩罚下的几乎无偏变量选择,《统计年鉴》,38,894-942(2010)·Zbl 1183.62120号 ·doi:10.1214/09-AOS729
[33] Zou,H.,自适应Lasso及其oracle属性,美国统计协会,101,1418-1429(2006)·Zbl 1171.62326号 ·doi:10.1198/016214500000735
[34] 邹,H。;Hastie,T.,《通过弹性网进行正则化和变量选择》,《皇家统计学会期刊:B辑》,67,301-320(2005)·Zbl 1069.62054号 ·文件编号:10.1111/j.1467-9868.2005.005.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。