×

分类解释变量的稀疏建模。 (英语) Zbl 1220.62092号

小结:回归分析中的收缩方法通常用于度量预测。然而,在本文中,提出了分类预测因子的收缩方法。作为一个应用,我们考虑慕尼黑租金标准中的数据,例如,市区被视为类别预测值。如果自变量是分类的,则需要对常用的收缩过程进行一些修改。提出并研究了两种基于(L{1})惩罚的因子选择和类别聚类方法。第一种方法是针对标称标度水平设计的,第二种方法是为序数预测值设计的。除了将其应用于慕尼黑租金标准之外,还对方法进行了说明,并在模拟研究中进行了比较。

MSC公司:

62J07型 岭回归;收缩估计器(拉索)
65C60个 统计中的计算问题(MSC2010)
62第25页 统计学在社会科学中的应用
62H30型 分类和区分;聚类分析(统计方面)
62第20页 统计学在经济学中的应用
90 C90 数学规划的应用
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Bondell,H.D.和Reich,B.J.(2009年)。方差分析中的同时因子选择和崩溃水平。生物识别65 169-177·兹比尔1159.62048 ·doi:10.1111/j.1541-0420.2008.01061.x
[2] Bühlmann,P.和Yu,B.(2003)。L2损失促进:回归和分类。J.Amer。统计师。协会98 324-339·Zbl 1041.62029号 ·doi:10.1198/0162145003000125
[3] Candes,E.和Tao,T.(2007)。dantzig选择器:当p远大于n时的统计估计。35 2313-2351. ·Zbl 1139.62019号 ·doi:10.1214/00905360000001523
[4] Efron,B.、Hastie,T.、Johnstone,I.和Tibshirani,R.(2004年)。最小角度回归。安。统计师。32 407-499. ·Zbl 1091.62054号 ·doi:10.1214/009053604000000067
[5] Fan,J.和Li,R.(2001)。通过非冲突惩罚似然及其oracle属性进行变量选择。J.Amer。统计师。协会96 1348-1360·Zbl 1073.62547号 ·doi:10.1198/016214501753382273
[6] Gerthiss,J.、Hogger,S.、Oberhauser,C.和Tutz,G.(2009年)。选择按顺序缩放的自变量。德国慕尼黑大学统计系技术报告62。
[7] Gerthiss,J.和Tutz,G.(2009年)。带有序数预测因子的惩罚回归。国际统计。版次77 345-365。
[8] Karatzoglou,A.、Smola,A.、Hornik,K.和Zeileis,A.(2004)。kernalab是R.J.Statist中内核方法的S4包。柔软。11 1-20.
[9] Kneib,T.、Heinzl,F.、Brezger,A.和Sabanés Bovés,D.(2009年)。BayesX:R实用程序随软件包BayesX提供。R包版本0.2。
[10] Land,S.R.和Friedman,J.H.(1997年)。变量融合:一种新的自适应信号回归方法。技术报告656,卡内基梅隆大学匹兹堡分校统计系。
[11] Meier,L.(2007)。grplasso:使用Group Lasso惩罚拟合用户指定的模型。R包版本0.2-1。
[12] Meier,L.、Van de Geer,S.和Bühlmann,P.(2008)。逻辑回归的集体套索。J.罗伊。统计师。Soc.序列号。B 70 53-71·Zbl 1400.62276号 ·文件编号:10.1111/j.1467-9868.2007.00627.x
[13] Meinshausen,N.(2007年)。放松的套索。计算。统计师。数据分析。52 374-393. ·Zbl 1452.62522号
[14] R开发核心团队(2009)。R: 统计计算语言和环境。奥地利维也纳:R统计计算基金会。为3-900051-07-0。
[15] Tibshirani,R.(1996)。通过套索回归收缩和选择。J.罗伊。统计师。Soc.序列号。乙58 267-288·Zbl 0850.62538号
[16] Tibshirani,R.、Saunders,M.、Rosset,S.、Zhu,J.和Kneight,K.(2005)。通过融合套索实现稀疏和流畅。J.罗伊。统计师。Soc.序列号。乙67 91-108·Zbl 1060.62049号 ·文件编号:10.1111/j.1467-9868.2005.00490.x
[17] Walter,S.D.、Feinstein,A.R.和Wells,C.K.(1987)。多元回归分析中有序自变量的编码。美国流行病学杂志125 319-323。
[18] Yuan,M.和Lin,Y.(2006)。分组变量回归中的模型选择和估计。J.罗伊。统计师。Soc.序列号。B 68 49-67·兹比尔1141.62030 ·doi:10.1111/j.1467-9868.2005302.x
[19] 邹华(2006)。自适应套索及其oracle属性。J.Amer。统计师。协会101 1418-1429·Zbl 1171.62326号 ·doi:10.1198/016214500000735
[20] Zou,H.和Hastie,T.(2005)。通过弹性网进行规则化和变量选择。J.罗伊。统计师。Soc.序列号。乙67 301-320·Zbl 1069.62054号 ·数字对象标识代码:10.1111/j.1467-9868.2005.0050.x
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。