×

广义线性模型中带分类预测因子和效应修正因子的正则化和模型选择。 (英语) Zbl 07257900号

摘要:在广义线性模型的框架内,考虑了带有类别效应修正的变系数模型。我们区分名义效应修正和序数效应修正,并提出适当的Lasso型正则化技术,允许(1)选择相关协变量,以及(2)识别实际随潜在效应修正因子水平变化的系数函数。对于计算,提出了一种惩罚迭代加权最小二乘算法。我们研究了惩罚估计的大样本性质;在仿真研究中,我们表明所提出的方法对有限样本也有很好的性能。此外,将提出的方法与其他方法进行了比较,并应用于实际数据。

MSC公司:

62-XX年 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Bondell,HD,Reich,BJ(2009)ANOVA中的同时因子选择和崩溃水平。生物统计学,65,169-77·兹比尔1159.62048 ·doi:10.1111/j.1541-0420.2008.01061.x
[2] Efron,B,Hastie,T,Johnstone,I,Tibshirani,R(2004)最小角度回归。统计年鉴,32407-99·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[3] Fahrmeir,L,Kaufmann,H(1985)广义线性模型中最大似然估计量的一致性和渐近正态性。《统计年鉴》,13,342-68·Zbl 0594.62058号 ·doi:10.1214/aos/1176346597
[4] Fan,J,Li,R(2001)基于非冲突惩罚似然的变量选择及其预言性质。美国统计协会杂志,961348-60·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[5] Fan,J,Zhang,W(1999)变系数模型中的统计估计。《统计年鉴》,第27期,1491-518页·Zbl 0977.62039号 ·doi:10.1214操作系统/1017939139
[6] Gerthiss,J,Tutz,G(2010)分类解释变量的稀疏建模。应用统计年鉴,42150-80·Zbl 1220.62092号 ·doi:10.1214/10-AOAS355
[7] Gertheiss,J,Tutz,G(2012)正则化和具有类别效应修饰符的模型选择。中国统计局,22957-82·Zbl 1257.62078号
[8] Hastie,T,Tibshirani,R(1993)变系数模型。英国皇家统计学会杂志。B系列,统计方法,55,757-96·兹比尔0796.62060
[9] Hoerl,AE,Kennard,RW(1970)岭回归:非正交问题的有偏估计。技术计量学,12,55-67·Zbl 0202.17205号 ·网址:10.1080/00401706.1970.10488634
[10] Hofner,B,Hothorn,T,Kneib,T(2012)结构化生存模型中的变量选择和模型选择。计算统计学,281079-101·Zbl 1305.65043号 ·文件编号:10.1007/s00180-012-0337-x
[11] Hoover,DR,Rice,JA,Wu,CO,Yang,L-P(1998)具有纵向数据的时变系数模型的非参数平滑估计。生物特征,85,809-22·Zbl 0921.62045号 ·doi:10.1093/biomet/85.4.809
[12] Kauermann,G,Tutz,G(2000)变系数模型中的局部似然估计,包括加性偏差校正。非参数统计杂志,12343-71·Zbl 0945.62044号 ·doi:10.1080/10485250008832812
[13] Koch,I(1996)关于中值平滑器在图像分析和非参数回归中的渐近性能。《统计年鉴》,第24期,1648-1666页·Zbl 0867.62031号 ·doi:10.1214/aos/1032298289
[14] Leng,C(2009)变系数模型选择的简单方法。《统计规划与推断杂志》,1392138-46·Zbl 1160.62067号 ·doi:10.1016/j.jspi.2008.10.009
[15] Lin,Y,Zhang,HH(2006)多元非参数回归中的成分选择和平滑。《统计年鉴》,34,2272-97·Zbl 1106.62041号 ·doi:10.1214/0090536000000722
[16] Lu,Y,Zhang,R,Zhu,L(2008)变系数模型的惩罚样条估计。统计学中的传播——理论和方法,372249-61·Zbl 1143.62023号 ·doi:10.1080/03610920801931887
[17] McCullagh,P(1983)拟似然函数。《统计年鉴》,第1159-67页·Zbl 0507.62025号 ·doi:10.1214/aos/1176346056
[18] Meier-Dinkel,L,Trautmann,J,Frieden,L,Tholen,E,Knorr,C,Sharifi,AR,Bücking,M,Wicke,M,Mörlein,D(2013)消费者对公猪肉的感知受标签信息、恶臭化合物和雄烯酮敏感性的影响。肉类科学,93248-56·doi:10.1016/j.meatsci.2012.09.002
[19] Mörlein,D,Grave,A,Sharifi,AR,Bücking,M,Wicke,M(2012)不同的烫伤技术不会影响公猪的感染。肉类科学,91,435-40·doi:10.1016/j.meatsci.2012.02.028
[20] Oelker,M-R(2013)gvcm.cat:GLM中的正则分类效应/分类效应修饰语。R软件包版本1.5。
[21] Oelker,M-R,Tutz,G(2013)在广义结构模型中组合不同类型处罚的一般处罚系列。统计部:技术报告139,http://epub.ub.uni-muenchen.de/14735/。
[22] R开发核心团队(2012)R:统计计算的语言和环境。奥地利维也纳,国际标准图书编号3-900051-07-0。
[23] Tibshirani,R(1996)通过LASSO回归收缩和选择。英国皇家统计学会杂志。B辑,统计方法,58,267-88·Zbl 0850.62538号
[24] Tibshirani,R,Saunders,M,Rosset,S,Zhu,J,Knight,K(2005)《通过融合LASSO实现的简约与流畅》。英国皇家统计学会杂志。B辑,统计方法,67,91-108·兹比尔1060.62049 ·doi:10.1111/j.1467-9868.2005.00490.x
[25] Ulbricht,J(2010)广义线性模型中的变量选择。慕尼黑大学统计系论文:Verlag Dr.Hut·Zbl 1277.62027号
[26] Wang,H,Xia,Y(2009)变系数模型的收缩估计。美国统计协会杂志,104,747-57·Zbl 1388.62213号 ·doi:10.1198/jasa.2009.0138
[27] Wang,L,Li,H,Huang,JZ(2008)用于重复测量分析的非参数变系数模型中的变量选择。美国统计协会杂志,103,1556-69·Zbl 1286.62034号 ·doi:10.1198/0162145000000788
[28] Wu,CO,Hoover,DR(1998)具有纵向数据的变系数模型核平滑的渐近置信区域。《美国统计协会杂志》,93,1388-89·Zbl 1064.62523号 ·doi:10.1080/01621459.1998.10473800
[29] Yuan,M,Lin,Y(2006)分组变量回归中的模型选择和估计。英国皇家统计学会杂志。B系列,统计方法,68,49-67·Zbl 1141.62030号 ·doi:10.1111/j.1467-9868.2005302.x
[30] Zou,H(2006)自适应LASSO及其oracle属性。美国统计协会杂志,1011418-29·Zbl 1171.62326号 ·doi:10.1198/016214500000735
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。