×

广义半线性回归树的进化估计过程。 (英语) Zbl 07800945号

摘要:在许多应用中,相互作用甚至轻微非线性的存在都会影响推断和预测。因此,我们建议使用介于统计和机器学习之间的一类模型,并提出一个学习过程。这些模型结合了线性部分和通过进化算法选择的树组件,可以用于任何类型的响应,例如连续、分类、有序响应和生存时间。它们本质上是可解释的,但比标准回归模型更灵活,因为它们很容易捕捉非线性和交互效应。提出的类遗传学习算法避免了对树组件的贪婪搜索。在仿真研究中,我们表明,该方法的性能可与其他机器学习算法媲美,在可解释性和透明度方面有显著提高,并且我们在实际数据集上演示了该方法。

MSC公司:

62-08 统计问题的计算方法
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Back T(1996)《理论与实践中的进化算法:进化策略、进化规划、遗传算法》。牛津大学出版社·Zbl 0877.68060号
[2] Benjamini,Y.,《同步和选择性推理:当前的成功和未来的挑战》,Biom J,52,6,708-721(2010)·Zbl 1208.62111号 ·doi:10.1002/bimj.200900299
[3] 伯克,R。;布朗,L。;Buja,A。;张凯。;Zhao,L.,有效的后选择推理,Ann Stat,41,2,802-837(2013)·Zbl 1267.62080号 ·doi:10.1214/12-AOS1077
[4] Breiman,L.,《随机森林》,《马赫学习》,第45、1、5-32页(2001年)·Zbl 1007.68152号 ·doi:10.1023/A:1010933404324
[5] Breiman,L.,《统计建模:两种文化》(作者评论和反驳,《统计科学》,16,3,199-231(2001)·Zbl 1059.62505号 ·doi:10.1214/ss/1009213726
[6] Breiman L、Friedman J、Stone CJ、Olshen RA(1984)分类和回归树。CRC出版社·Zbl 0541.62042号
[7] Chatterjee,S。;Laudato,M。;Lynch,LA,《遗传算法及其统计应用:简介》,《计算统计数据分析》,22,6,633-651(1996)·Zbl 0900.62336号 ·doi:10.1016/0167-9473(96)00011-4
[8] 奇普曼,HA;乔治,EI;McCulloch,RE,Bart:贝叶斯加性回归树,Ann Appl Stat,4,1,266-298(2010)·Zbl 1189.62066号 ·doi:10.1214/09-AOAS285
[9] Claeskens G、Hjort NL等人(2008)模型选择和模型平均。剑桥图书·Zbl 1166.62001号
[10] Conversano,C。;杜塞尔多普,E.,通过后勤分类主干模拟阈值交互效应,J Classif,34,3,399-426(2017)·Zbl 1381.62160号 ·doi:10.1007/s00357-017-9241-y
[11] Cox,DR,《用于评估显著性水平的数据分割注释》,Biometrika,62,2,441-444(1975)·Zbl 0309.62014号 ·doi:10.1093/biomet/62.2.441
[12] Davison AC(2003)统计模型,第11卷。剑桥大学出版社·Zbl 1044.62001年
[13] Doshi-Velez F,Kim B(2017)《走向可解释机器学习的严格科学》。arXiv预印本arXiv:1702.08608
[14] 杜塞尔多夫,E。;Meulman,JJ,发现治疗协变量交互作用的回归树干方法,《心理测量学》,69,3,355-374(2004)·Zbl 1306.62405号 ·doi:10.1007/BF02295641
[15] 杜塞尔多普,E。;Conversano,C。;Van Os,BJ,同时结合加性和基于树的回归模型:STIMA,J Comput Graph Stat,19,3,514-530(2010)·doi:10.1198/jcgs.2010.06089
[16] Efron,B.,《预测、估计和归因》,美国统计协会期刊,115,530,636-655(2020)·Zbl 1445.62327号 ·doi:10.1080/01621459.2020.1762613
[17] 风扇,G。;Gray,JB,使用目标进行回归树分析,J Comput Graph Stat,14,1,206-218(2005)·doi:10.1198/106186005X37210
[18] Fithian W,Sun D,Taylor J(2014)模型选择后的最优推理。arXiv预打印arXiv:1410.2597
[19] Friedman,JH,多元自适应回归样条,Ann Stat,19,1,1-67(1991)·Zbl 0765.62064号
[20] Geurts,P。;Ernst,D。;Wehenkel,L.,《极度随机树》,《马赫学习》,第63、1、3-42页(2006年)·Zbl 1110.68124号 ·doi:10.1007/s10994-006-6226-1
[21] Gottard,A。;Vannucci,G。;GM Marchetti,《基于树的回归模型解释说明》,Biom J,62,6,1564-1573(2020)·Zbl 1448.62166号 ·doi:10.1002/bimj.201900195
[22] Grubinger,T。;Zeileis,A。;Pfeiffer,K-P,evtree:R中全局最优分类和回归树的进化学习,J Stat Softw,61,1,1-29(2014)·doi:10.18637/jss.v061.i01
[23] 吉多蒂,R。;Monreale,A。;Ruggieri,S。;图里尼,F。;Giannotti,F。;Pedreschi,D.,黑箱模型解释方法调查,ACM Compute Surv(CSUR),51,5,93(2018)
[24] Hothorn,T。;霍尼克,K。;Zeileis,A.,无偏递归划分:一个条件推理框架,J Comput Graph Stat,15,35651-674(2006)·doi:10.1198/106186006X133933
[25] Loh,W-Y,带无偏变量选择和交互检测的回归压力,中国统计,12361-386(2002)·Zbl 0998.62042号
[26] Meyer,MC,《进化算法在统计学中的应用》,《计算图统计杂志》,12,2,265-281(2003)·doi:10.1198/1061860031699
[27] Molnar C、König G、Herbinger J、Freiesleben T、Dandl S、Scholbeck CA、Casalicchio G、Grosse-Wentrup M、Bischl B(2020)解释机器学习模型时要避免的陷阱。arXiv预打印arXiv:2007.04131
[28] 默西,SK;Kasif,S。;Salzberg,S.,《斜决策树归纳系统》,J Artif Intell Res,2,1,1-32(1994)·兹比尔0900.68335 ·doi:10.1613/jair.63
[29] R核心团队(2021)R:统计计算的语言和环境。奥地利维也纳R统计计算基金会
[30] Rudin C,Radin J(2019)为什么我们不需要在人工智能中使用黑盒模型?一场可解释的人工智能竞赛的教训。哈佛数据科学评论1(2)。doi:10.1162/99608f92.5a8a3a3d
[31] Shmueli,G.,解释还是预测?,《统计科学》,25,3,289-310(2010)·Zbl 1329.62045号 ·doi:10.1214/10-STS330
[32] Sutton RS、Barto AG等(1998)《强化学习:导论》。麻省理工学院出版社·Zbl 1407.68009号
[33] Voigt P,Von dem Bussche A(2017)《欧盟一般数据保护条例》(GDPR)。摘自:实用指南,第1版。查姆施普林格,第10卷,第3152676页
[34] Wermuth,N。;Cox,DR,关于独立图上定义的关联模型,Bernoulli,4,4,477-495(1998)·Zbl 1037.62054号 ·doi:10.2307/3318662
[35] 朱,R。;曾博士。;科索罗克,MR,强化学习树,J Am Stat Assoc,110,512,1770-1784(2015)·Zbl 1374.68466号 ·doi:10.1080/01621459.2015.1036994
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。