×

诚实回归树的不确定性量化。 (英语) 兹比尔07446470

摘要:开发了一种新的方法来量化真实随机森林产生的估计和预测的不确定性。这种新方法基于广义基准方法,并提供了一个基准密度函数,用于测量每个诚实树成为真实模型的可能性。利用这种密度函数,可以获得估计和预测,以及它们的置信度/预测区间。通过与几种最新方法的数值比较,以及对几个实际数据集的应用,证明了该方法具有良好的经验特性。最后,提出的方法得到了渐近保证的理论支持。

MSC公司:

62至XX 统计
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 亚松森,A。;Newman,D.,UCI机器学习库(2007)
[2] Athey,S。;Tibshirani,J。;Wager,S.,《广义随机森林》,Ann.Stat.,47,1148-1178(2019)·Zbl 1418.62102号
[3] Biau,G.,《随机森林模型分析》,J.Mach。学习。第13号决议,1063-1095(2012年)·Zbl 1283.62127号
[4] Breiman,L.,装袋预测,马赫数。学习。,24123-140(1996年)·Zbl 0858.68080号
[5] Breiman,L.,《随机森林》,马赫。学习。,45, 5-32 (2001) ·Zbl 1007.68152号
[6] 卡斯蒂略,I。;Rousseau,J.,半参数模型中光滑泛函的Bernstein-von Mises定理,Ann.Stat.,43,2353-2383(2015)·Zbl 1327.62302号
[7] Chipman,H.A。;E.I.乔治。;McCulloch,R.E.,贝叶斯集成学习,(神经信息处理系统进展(2007)),265-272
[8] 奇普曼,H.A。;E.I.乔治。;McCulloch,R.E.,BART:贝叶斯加性回归树,Ann.Appl。统计,4266-298(2010)·兹比尔1189.62066
[9] Dempster,A.P.,《面向统计学家的Dempster-Shafer演算》,《国际期刊近似推理》。,48, 365-377 (2008) ·兹比尔1274.62053
[10] 丹尼尔,M。;Matheson,D。;De Freitas,N.,《缩小差距:理论和实践中的随机森林》(机器学习国际会议(2014)),665-673
[11] Denison,D.G。;马利克,B.K。;Smith,A.F.,贝叶斯CART算法,生物特征,85,363-377(1998)·兹比尔1048.62502
[12] Dua,D。;Graff,C.,UCI机器学习库(2017)
[13] Efron,B.,《模型选择后的估计和准确性》,美国统计协会,109991-1007(2014)·Zbl 1368.62071号
[14] Fisher,R.A.,《逆概率》,《剑桥哲学学会数学论文集》,第26卷,528-535(1930),剑桥大学出版社·JFM 56.1083.05号机组
[15] 高奇。;赖,R.C.S。;Lee,T.C.M。;Li,Y.,高维稀疏非参数加性模型的不确定性量化,技术计量学,62513-524(2020)
[16] Hannig,J。;Lee,T.C.M.,小波回归的广义基准推断,生物统计学,96,847-860(2009)·Zbl 1179.62057号
[17] Hannig,J。;Iyer,H。;赖,R.C.S。;Lee,T.C.M.,《广义基准推断:回顾与新结果》,美国统计协会,111,1346-1361(2016)
[18] 哈里森,D。;Rubinfeld,D.L.,《Hedonic房价与清洁空气需求》,J.Environ。经济。管理。,5, 81-102 (1978) ·Zbl 0375.90023号
[19] Kaya,H。;Tüfekci,P。;Gürgen,F.S.,预测燃气和蒸汽联合涡轮机功率的本地和全球学习方法,(计算机和电子工程新兴趋势国际会议论文集ICETCEE(2012)),13-18
[20] 赖,R.C。;Hannig,J。;Lee,T.C.M.,超高维回归的广义基准推断,美国统计协会,110,760-772(2015)·Zbl 1373.62111号
[21] 马丁·R。;Liu,C.,条件推理模型:结合信息进行先验自由概率推理,J.R.Stat.Soc.Ser。B、 77、195-217(2015)·Zbl 1414.62093号
[22] 马丁·R。;Liu,C.,边际推断模型:利益参数的无先验概率推断,美国统计协会,110,1621-1631(2015)·Zbl 1373.62028号
[23] 马丁·R。;张杰。;Liu,C.,Dempster-Shafer理论和弱信念的统计推断,Stat.Sci。,25, 72-87 (2010) ·Zbl 1328.62040号
[24] Mendes-Moreira,J。;苏亚雷斯,C。;Jorge,A.M。;Sousa,J.F.D.,回归的集合方法:调查,ACM计算。调查。,45, 10 (2012) ·Zbl 1293.68234号
[25] 曼奇,L。;Hooker,G.,通过置信区间和假设检验量化随机森林中的不确定性,J.马赫。学习。研究,17,841-881(2016)·Zbl 1360.62095号
[26] 佩罗内,M.P。;Cooper,L.N.,《当网络不一致时:混合神经网络的集成方法》(1992年),布朗大学普罗维登斯理学院脑和神经系统研究所,技术报告
[27] Rockova,V.,《关于BART的半参数推断》,(机器学习国际会议,第119卷(2020年)),8137-8146
[28] Tüfekci,P.,使用机器学习方法预测基本负荷运行联合循环发电厂的满载电力输出,国际电工杂志。电力能源系统。,60, 126-140 (2014)
[29] Wager,S。;Athey,S.,《使用随机森林评估和推断异质处理效应》,美国统计协会,1131228-1242(2018)·Zbl 1402.62056号
[30] Wager,S。;哈斯蒂,T。;Efron,B.,《随机森林的置信区间:折刀和无穷小折刀》,J.Mach。学习。第15号决议,1625-1651(2014)·Zbl 1319.62132号
[31] 王,H。;风扇,W。;余,P.S。;Han,J.,使用集成分类器挖掘概念驱动数据流,(第九届ACM SIGKDD知识发现和数据挖掘国际会议论文集(2003),ACM),226-235
[32] Weerahandi,S.,广义置信区间,(数据分析的精确统计方法(1995),Springer),143-168
[33] Weerahandi,S.,《数据分析的精确统计方法》(2013),Springer Science&Business Media
[34] Wu,S。;Hannig,J。;Lee,T.C.,《主成分回归的不确定性量化》,电子。J.Stat.,15,2157-2178(2021)·Zbl 1471.62396号
[35] Wu,Y。;Tjelmeland,H。;West,M.,Bayesian CART:先验规范和后验模拟,J.Compute。图表。《法律总汇》,16,44-66(2007)
[36] 谢先生。;Singh,K.,《置信分布,参数的频率分布估计:综述》,《国际统计评论》,第81期,第3-39页(2013年)·Zbl 1416.62170号
[37] 谢先生。;辛格,K。;Strawderman,W.E.,《元分析的置信分布和统一框架》,美国统计协会期刊,106,320-333(2011)·Zbl 1396.62051号
[38] Yeh,I.-C.,《使用人工神经网络的高性能混凝土强度建模》,Cem。混凝土。第28号决议,1797-1808(1998)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。