×

随机森林带外误差残差方差的一致估计。 (英语) Zbl 1459.62056号

摘要:在具有未知和最终复杂链接函数的回归模型中估计残差方差的问题仍然是一个悬而未决的问题。这种结果的预测通常由黑盒程序进行,而不会严重限制链接函数类。然而,通过残差方差估计器量化不确定性在许多实际应用中具有重要意义,例如作为构建预测区间的首要步骤。在这里,我们考虑随机森林的这个问题。其中,协变量和响应变量之间的函数关系由后者的加权和建模。然而,依赖结构涉及到树构造过程中构建的权重,这使得模型在数学分析中变得复杂。限制于(L_2)一致随机森林模型,我们提供了基于随机森林的残差方差估计,并证明了它们的一致性。

MSC公司:

62G08号 非参数回归和分位数回归
6220国集团 非参数推理的渐近性质
62H30型 分类和区分;聚类分析(统计方面)
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Biau,G。;Devroye,L.,《关于分层最近邻估计、袋装最近邻估计和回归分类中的随机森林法》,《多元分析》。,101, 10, 2499-2518 (2010) ·Zbl 1198.62048号
[2] Biau,G。;Devroye,L。;Lugosi,G.,《随机森林和其他平均分类器的一致性》,J.Mach。学习。2015-2033年第9、9号决议(2008年)·Zbl 1225.62081号
[3] Breiman,L.,《随机森林》,马赫。学习。,45,1,5-32(2001年)·Zbl 1007.68152号
[4] Khalilia,M。;Chakraborty,S。;Popescu,M.,《使用随机森林从高度不平衡数据预测疾病风险》,BMC Med.Inform。决策。,11, 1, 51 (2011)
[5] Lin,Y。;Jeon,Y.,《随机森林和自适应近邻》,J.Amer。统计师。协会,101,474,578-590(2006)·Zbl 1119.62304号
[6] Meinshausen,N.,分位数回归森林,J.Mach。学习。第7、6、983-999号决议(2006年)·Zbl 1222.68262号
[7] Mendez,G。;Lohr,S.,估计随机森林回归中的剩余方差,计算。统计师。数据分析。,55, 11, 2937-2950 (2011) ·Zbl 1218.62035号
[8] 曼奇,L。;Hooker,G.,通过置信区间和假设检验量化随机森林中的不确定性,J.马赫。学习。研究,17,1,841-881(2016)·Zbl 1360.62095号
[9] 曼奇,L。;胡克,G.,《随机森林中加性结构的形式假设检验》,J.Compute。图表。统计人员。,26, 3, 589-597 (2017)
[10] Ramosaj,B.,Pauly,M.,2017年。预测缺失值:非参数插补方法的比较研究。,arXiv预打印arXiv:1711.11394;Ramosaj,B.,Pauly,M.,2017年。预测缺失值:非参数插补方法的比较研究。,arXiv预印本arXiv:1711.111394
[11] Scornet,E.,《关于随机森林的渐近性》,J.《多元分析》。,146, 72-83 (2016) ·兹比尔1337.62063
[12] Scornet,E.公司。;Biau,G。;Vert,J.-P.,《随机森林的一致性》,《统计年鉴》。,43, 4, 1716-1741 (2015) ·Zbl 1317.62028号
[13] Wager,S。;Athey,S.,《使用随机森林评估和推断异质处理效果》,J.Amer。统计师。协会,113,523,1228-1242(2018)·Zbl 1402.62056号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。