×

回归的无分布预测推断。 (英语) Zbl 1402.62155号

摘要:我们使用保角推理为回归中的无分布预测推理开发了一个通用框架。所提出的方法允许使用回归函数的任何估计来构建响应变量的预测带。得到的预测带在标准假设下保持了原始估计器的一致性,同时保证了有限样本边缘覆盖,即使这些假设不成立。我们从经验和理论上分析和比较了共形框架的两个主要变体:完全共形推理和分裂共形推理,以及相关的折刀方法。这些方法在统计准确性(结果预测间隔的长度)和计算效率之间提供了不同的折衷。作为扩展,我们开发了一种构造有效样本内预测区间的方法,称为排名第一共形推理,其基本上具有相同的计算效率为分裂共形推理。我们还描述了我们生成局部长度可变的预测带的程序的扩展,以适应数据中的异方差。最后,我们提出了变量重要性的无模型概念,称为离开一个协变量或LOCO推断。本文附带了一个R包,它实现了我们介绍的所有建议。本着再现性的精神,我们所有的实验结果也可以使用这个软件包轻松(重新)生成。

MSC公司:

62J05型 线性回归;混合模型
62J12型 广义线性模型(逻辑模型)
62-04 统计相关问题的软件、源代码等
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 贝洛尼,A。;陈,D。;切尔诺朱科夫,V。;Hansen,C.,《最优仪器的稀疏模型和方法及其在征用领域的应用》,计量经济学, 80, 2369-2429, (2012) ·Zbl 1274.62464号
[2] 伯克,R。;布朗,L。;Buja,A。;张凯。;Zhao,L.,有效的岗位选择推理,统计年刊, 41, 802-837, (2013) ·Zbl 1267.62080号
[3] Bickel,P.J。;Ritov,Y。;Tsybakov,A.B.,套索和Dantzig选择器的同时分析,统计年鉴, 37, 1705-1732, (2009) ·Zbl 1173.62022号
[4] Breiman,L.,《随机森林》,机器学习, 45, 5-32, (2001) ·Zbl 1007.68152号
[5] Buhlmann,P.,高维线性模型的统计显著性,伯努利, 19, 1212-1242, (2013) ·Zbl 1273.62173号
[6] Buja,A。;伯克,R。;布朗,L。;乔治·E。;皮特金,E。;特拉斯金,M。;张凯。;赵,L.,模型近似,第一部分:线性回归中非线性和随机回归因子的合谋”,未出版手稿,(2014)
[7] 布尼亚,F。;Tsybakov,A。;Wegkamp,M.,套索的稀疏预言不等式,电子统计杂志,169-194年1月,(2007年)·Zbl 1146.62028号
[8] 伯纳耶夫,E。;Vovk,V.,共形脊回归的效率,学习理论年度会议记录, 25, 605-622, (2014)
[9] 巴特勒,R。;Rothman,E.,基于重复使用样本的预测间隔,美国统计协会杂志, 75, 881-889, (1980) ·Zbl 0472.62045号
[10] Efroymson,文学硕士。;拉尔斯顿,A。;Wilf,H.S.,多元回归分析,数字计算机的数学方法,191-203,(1960),纽约威利·Zbl 0089.12602号
[11] Fithian,W。;Sun,D。;Taylor,J.,模型选择后的最优推理,(2014)
[12] Hebiri,M.,稀疏共形预测,统计与计算, 20, 253-266, (2010)
[13] 爪哇马德,A。;Montanari,A.,高维回归的置信区间和假设检验,机器学习研究杂志, 15, 2869-2909, (2014) ·Zbl 1319.62145号
[14] Lee,J。;Sun,D。;孙,Y。;Taylor,J.,《精确后选择推理及其在套索中的应用》,统计年刊, 44, 907-927, (2016) ·Zbl 1341.62061号
[15] Lei,J.,《信心分类》,生物计量学, 101, 755-769, (2014) ·Zbl 1306.62143号
[16] Lei,J。;里纳尔多,A。;Wasserman,L.,探索功能数据的保角预测方法,数学与人工智能年鉴, 74, 29-43, (2015) ·Zbl 1317.62039号
[17] Lei,J。;罗宾斯,J。;Wasserman,L.,无分布预测集,美国统计协会杂志, 108, 278-287, (2013) ·Zbl 06158342号
[18] 雷,J。;Wasserman,L.,非参数回归的无分布预测带,英国皇家统计学会杂志, 76, 71-96, (2014) ·Zbl 1411.62103号
[19] 明绍森,N。;Buhlmann,P.,稳定性选择,英国皇家统计学会杂志, 72, 417-473, (2010) ·Zbl 1411.62142号
[20] 帕帕佐普洛斯,H。;普罗德罗,K。;沃夫克,V。;Gammerman,A。;Elomaa,T。;Mannila,H。;Toivonen,H.,回归的归纳置信机,机器学习:ECML 2002,345-356,(2002),纽约斯普林格·Zbl 1014.68514号
[21] 拉维库马尔,P。;Lafferty,J。;刘,H。;Wasserman,L.,稀疏加性模型,英国皇家统计学会杂志, 71, 1009-1030, (2009) ·Zbl 1411.62107号
[22] 斯坦伯格,L。;Leeb,H.,多变量线性回归模型中的Leave-on-out预测区间,(2016)
[23] Thakurta,A.G。;Smith,A.,通过稳定性参数进行差异私有特征选择,以及套索的鲁棒性,学习理论会议, 819-850, (2013)
[24] 田,X。;Taylor,J.,选择推理的渐近性,斯堪的纳维亚统计杂志, 44, 480-499, (2017) ·Zbl 1422.62252号
[25] 随机反应的选择性推理,统计年刊, 46, 679-710, (2018) ·兹比尔1392.62144
[26] Tibshirani,R.,通过套索进行回归收缩和选择,英国皇家统计学会杂志, 267-288, (1996) ·Zbl 0850.62538号
[27] 蒂布希拉尼,R.J。;泰勒,J。;罗克哈特。;Tibshirani,R.,序贯回归程序的精确选择后推断,美国统计协会杂志, 111, 600-620, (2016)
[28] van de Geer,S。;Buhlmann,P。;Ritov,Y。;Dezeure,R.,关于高维模型的渐近最优置信区和检验,统计年刊, 42, 1166-1201, (2014) ·Zbl 1305.62259号
[29] Vovk,V.,归纳共形预测因子的条件有效性,机器学习, 92, 349-376, (2013) ·Zbl 1273.68307号
[30] 沃夫克,V。;Gammerman,A。;谢弗,G。,随机世界中的算法学习(2005),纽约斯普林格·Zbl 1105.68052号
[31] 沃夫克,V。;努列丁诺夫,I。;Gammerman,A.,在线预测线性回归,统计年鉴, 37, 1566-1590, (2009) ·Zbl 1160.62065号
[32] Wasserman,L.,《讨论:套索的显著性检验》,统计年刊, 42, 501-508, (2014) ·Zbl 1305.62257号
[33] 张,C.-H。;Zhang,S.,高维线性模型中低维参数的置信区间,英国皇家统计学会杂志, 76, 217-242, (2014) ·Zbl 1411.62196号
[34] 邹,H。;Hastie,T.,通过弹性网络的正则化和变量选择,英国皇家统计学会杂志, 67, 301-320, (2005) ·Zbl 1069.62054号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。