×

通过边际经验似然对非参数和半参数模型进行局部独立性特征筛选。 (英语) Zbl 1486.62082号

摘要:我们考虑使用独立特征筛选技术来识别解释变量,这些解释变量在高维回归分析中对响应变量有局部贡献。在不需要底层数据模型的特定参数形式的情况下,我们的方法适用于广泛的非参数和半参数模型族。为了检测解释变量的局部贡献,我们的方法结合边际非参数回归局部构造经验似然。由于我们的方法实际上不需要估计,因此它在诸如单指数模型这样的场景中非常有利,因为即使是边际模型的规范和识别也是一个问题。通过自动合并非参数回归的变异水平,并直接评估支持每个解释变量局部贡献的数据证据的强度,我们的方法为解决特征筛选问题提供了独特的视角。理论分析表明,我们的方法可以处理随样本大小呈指数增长的数据维度。通过大量的理论说明和数值例子,我们表明局部独立筛选方法具有良好的性能。

理学硕士:

62G05型 非参数估计
62G08号 非参数回归和分位数回归
62甲12 多元分析中的估计
6220国集团 非参数推理的渐近性质
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Brillinger,D.R.(1983年)。具有“高斯”回归变量的广义线性模型。在Erich L.Lehmann的Festschrift(P.J.Bickel,K.A.Doksum和J.L.Hodges编辑)97-114中。加利福尼亚州贝尔蒙特市沃兹沃斯·Zbl 0519.62050号
[2] Bühlmann,P.和van de Geer,S.(2011)。高维数据统计:方法、理论和应用。海德堡施普林格·Zbl 1273.62015年 ·doi:10.1007/978-3-642-20192-9
[3] Chang,J.,Chen,S.X.和Chen,X.(2015)。具有相关数据的力矩限制的高维广义经验似然。《计量经济学杂志》185 283-304·Zbl 1331.62188号 ·doi:10.1016/j.jeconom.2014.10.011
[4] Chang,J.、Tang,C.Y.和Wu,Y.(2013a)。边际经验似然和确定独立性特征筛选。安。统计师。41 2123-2148. ·Zbl 1277.62109号 ·doi:10.1214/13-AOS1139
[5] Chang,J.、Tang,C.Y.和Wu,Y.(2013b)。补充“边际经验可能性和确定独立性特征筛选”·Zbl 1277.62109号 ·doi:10.1214/13-AOS1139
[6] Chang,J.、Tang,C.Y.和Wu,Y.(2016)。补充“通过边际经验似然对非参数和半参数模型进行局部独立性特征筛选”·Zbl 1486.62082号
[7] Chen,S.X.(1996)。非参数密度估计的经验似然置信区间。生物特征83 329-341·兹比尔0864.62017 ·doi:10.1093/biomet/83.2.329
[8] Chen,S.X.,Peng,L.和Qin,Y.-L.(2009)。数据维度对经验似然的影响。生物特征96 711-722·Zbl 1170.62023号 ·doi:10.1093/biomet/asp037
[9] Chen,S.X.和Qin,Y.S.(2000)。局部线性平滑器的经验似然置信区间。生物特征87 946-953·Zbl 1028.62034号 ·doi:10.1093/biomet/87.4.946
[10] Chen,S.X.和Van Keilegom,I.(2009年)。回归的经验似然方法综述。测试18 415-447·Zbl 1203.62035号 ·文件编号:10.1007/s11749-009-0159-5
[11] Fan,J.、Feng,Y.和Song,R.(2011)。稀疏超高维可加模型中的非参数独立筛选。J.Amer。统计师。协会106 544-557·Zbl 1232.62064号 ·doi:10.1198/jasa.2011.tm09779
[12] Fan,J.和Gijbels,I.(1996年)。局部多项式建模及其应用。统计学和应用概率专著66。查普曼和霍尔,伦敦·兹比尔0873.62037
[13] Fan,J.和Lv,J.(2008)。确保超高维特征空间的独立筛选。J.R.统计社会服务。B.统计方法。70 849-911. ·doi:10.1111/j.1467-9868.2008.00674.x
[14] Fan,J.和Lv,J.(2010)。高维特征空间中变量选择的选择性概述。统计师。Sinica 20 101-148号·Zbl 1180.62080号
[15] Fan,J.、Ma,Y.和Dai,W.(2014)。稀疏超高维变系数模型中的非参数独立筛选。J.Amer。统计师。协会109 1270-1284·Zbl 1368.62095号 ·doi:10.1080/01621459.2013.879828
[16] Fan,J.、Samworth,R.和Wu,Y.(2009年)。超高维特征选择:超越线性模型。J.马赫。学习。2013-2038年第10号决议·Zbl 1235.62089号
[17] Fan,J.和Song,R.(2010年)。具有NP-维数的广义线性模型中的确定独立筛选。安。统计师。38 3567-3604. ·Zbl 1206.68157号 ·doi:10.1214/10-AOS798
[18] Fan,J.和Zhang,J.-T.(2000)。函数线性模型的两步估计及其在纵向数据中的应用。J.R.统计社会服务。B.统计方法。62 303-322. ·doi:10.1111/1467-9868.00233
[19] Härdle,W.(1990年)。应用非参数回归。计量经济学社会专题论文19。剑桥大学出版社,剑桥·Zbl 0714.62030号
[20] Hastie,T.、Tibshirani,R.和Friedman,J.(2009)。《统计学习的要素:数据挖掘、推断和预测》,第二版,纽约斯普林格出版社·Zbl 1273.62005年 ·doi:10.1007/978-0-387-84858-7
[21] Hjort,N.L.、McKeague,I.W.和Van Keilegom,I.(2009年)。扩大了经验可能性的范围。安。统计师。37 1079-1111. ·Zbl 1160.62029号 ·doi:10.1214/07-AOS555
[22] Huang,J.、Horowitz,J.L.和Wei,F.(2010)。非参数可加模型中的变量选择。安。统计师。38 2282-2313. ·兹比尔1202.62051 ·doi:10.1214/09-AOS781
[23] Huang,J.Z.,Wu,C.O.和Zhou,L.(2002)。用于重复测量分析的变系数模型和基函数近似。生物特征89 111-128·Zbl 0998.62024号 ·doi:10.1093/biomet/89.1.111
[24] Leng,C.和Tang,C.Y.(2012)。惩罚经验似然和增长维一般估计方程。生物特征99 703-716·Zbl 1437.62522号 ·doi:10.1093/biomet/ass014
[25] Li,R.、Zhong,W.和Zhu,L.(2012年)。通过远程相关学习进行特征筛选。J.Amer。统计师。协会107 1129-1139·Zbl 1443.62184号 ·doi:10.1080/01621459.2012.695654
[26] Li,G.,Peng,H.,Zhang,J.和Zhu,L.(2012)。基于稳健秩相关的筛选。安。统计师。40 1846-1877. ·Zbl 1257.62067号 ·doi:10.1214/12-AOS1024
[27] Lin,Y.和Zhang,H.H.(2006)。多元非参数回归中的成分选择与平滑。安。统计师。34 2272-2297. ·兹比尔1106.62041 ·doi:10.1214/0090536000000722
[28] Liu,J.,Li,R.和Wu,R.(2014)。具有超高维协变量的变系数模型的特征选择。J.Amer。统计师。协会109 266-274·Zbl 1367.62048号 ·doi:10.1080/016214519.2013.850086
[29] Mai,Q.和Zou,H.(2013)。用于高维二进制分类中变量筛选的Kolmogorov滤波器。生物特征100 229-234·Zbl 1452.62456号 ·doi:10.1093/biomet/ass062
[30] Müller,H.-G.(1987)。非参数曲线拟合的加权局部回归和核方法。J.Amer。统计师。协会82 231-238·兹比尔0632.62039 ·doi:10.2307/2289159
[31] Owen,A.B.(1988年)。单个函数的经验似然比置信区间。生物特征75 237-249·兹伯利0641.62032 ·doi:10.1093/biomet/75.2.237
[32] Owen,A.(1991年)。线性模型的经验似然性。安。统计师。19 1725-1747. ·Zbl 0799.62048号 ·doi:10.1214/aos/1176348368
[33] Owen,A.B.(2001年)。经验可能性。查普曼和霍尔/CRC,纽约·Zbl 0989.62019
[34] Petrov,V.V.(1995)。概率论极限定理:独立随机变量序列。牛津概率研究4。牛津大学出版社,纽约·Zbl 0826.60001号
[35] Qu,A.和Li,R.(2006)。具有纵向数据的变系数模型的二次推理函数。生物统计学62 379-391·Zbl 1097.62037号 ·文件编号:10.1111/j.1541-0420.2005.00490.x
[36] Song,R.,Yi,F.和Zou,H.(2014)。高维变系数模型的变系数独立筛选。统计师。Sinica 24 1735-1752年·Zbl 1480.62151号
[37] Stone,C.J.(1985)。加性回归和其他非参数模型。安。统计师。13 689-705. ·Zbl 0605.62065号 ·doi:10.1214/aos/1176349548
[38] Tang,C.Y.和Leng,C.(2010)。惩罚高维经验可能性。生物特征97 905-919·Zbl 1204.62050 ·doi:10.1093/biomet/asq057
[39] 朱,L.-P.,李,L.,李,R.和朱,L.-X.(2011)。超高维数据的无模型特征筛选。J.Amer。统计师。协会106 1464-1475·兹比尔1233.62195 ·doi:10.1198/jasa.2011.tm10563
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。