×

贪婪函数近似:梯度增强机。 (英语) Zbl 1043.62034号

小结:函数估计/近似是从函数空间的数值优化而非参数空间的角度来看的。在分段加性展开和最速下降最小化之间建立了联系。针对基于任何拟合准则的可加性展开,提出了一种通用的梯度下降“boosting”范式。针对回归的最小二乘、最小绝对偏差和Huber-M损失函数,给出了具体算法[P.Huber公司,安。数学。《美国联邦法律大全》第35卷,第73–101页(1964年;Zbl 0136.39805号)]和分类的多类逻辑似然。针对个别可加组件是回归树的特殊情况,我们进行了特殊的增强,并提供了解释这种“TreeBoost”模型的工具。回归树的梯度增强为回归和分类产生了竞争性的、高度健壮的、可解释的过程,特别适用于挖掘不太干净的数据。这种方法与Y.弗伦德R.E.夏皮雷[参见J.Compute.Syst.Sci.55、119–139(1997;Zbl 0880.68103号)]和J.Friedman、T.HastieR.蒂比拉尼【Ann.Stat.28,337–407(2000年;Zbl 1106.62323号)]进行了讨论。

理学硕士:

62G08号 非参数回归和分位数回归
62-07 数据分析(统计)(MSC2010)
65C60个 统计中的计算问题(MSC2010)
62K10型 统计块设计

关键词:

决策树;稳健回归

软件:

ICE箱
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Becker,R.A.和Cleveland,W.S(1996年)。网格显示的设计和控制。J.计算。统计师。图形5 123-155。
[2] Breiman,L.(1997)。将片段粘贴在一起,以便在大型数据集和在线中进行预测。技术报告,加州大学伯克利分校统计系。
[3] Breiman,L.(1999)。预测游戏和电弧算法。神经补偿。11 1493-1517.
[4] Breiman,L.、Friedman,J.H.、Olshen,R.和Stone,C.(1983年)。分类和回归树。加利福尼亚州贝尔蒙特市沃兹沃斯·Zbl 0541.62042号
[5] Copas,J.B.(1983年)。回归、预测和收缩(讨论)。J.罗伊。统计师。Soc.序列号。乙45 311-354。JSTOR公司:·Zbl 0532.62048号
[6] Donoho,D.L.(1993)。从间接数据和噪声数据中恢复信号、密度和光谱的非线性小波方法。从不同的角度分析小波。应用数学研讨会论文集(I.Daubechies,ed.)47 173-205。阿默尔。数学。普罗维登斯州Soc·Zbl 0786.62094号
[7] Drucker,H.(1997)。使用增强技术改进回归变量。《第十四届机器学习国际会议论文集》(D.Fisher,Jr.,ed.)107-115。旧金山MorganKaufmann。
[8] Duffy,N.和Helmbold,D.(1999)。利用弱势学习者的几何方法。计算学习理论。第四届欧洲会议论文集EuroCOLT99(P.Fischer和H.U.Simon编辑)18-33。纽约州施普林格·Zbl 0997.68166号 ·doi:10.1016/S0304-3975(01)00083-4
[9] Freund,Y.和Schapire,R.(1996)。实验一种新的boosting算法。在机器学习:第十三届国际会议论文集148-156。摩根·考夫曼(Morgan Kaufman),旧金山。
[10] Friedman,J.H.(1991)。多元自适应回归样条(带讨论)。安。统计师。19 1-141. ·Zbl 0765.62064号 ·doi:10.1214/aos/1176347963
[11] Friedman J.H.、Hastie,T.和Tibshirani,R.(2000)。加性logistic回归:关于增长的统计观点(附讨论)。安。统计师。28 337-407·兹比尔1106.62323 ·doi:10.1214/aos/1016218223
[12] Griffin,W.L.、Fisher,N.I.、Friedman J.H.、Ryan,C.G.和O'Reilly,S.(1999)。岩石圈地幔中的Cr-Pyrope石榴石。《岩石学杂志》。40 679-704.
[13] Hastie,T.和Tibshirani,R.(1990年)。广义加性模型。查普曼和霍尔,伦敦·Zbl 0747.62061号
[14] Huber,P.(1964年)。位置参数的稳健估计。安。数学。统计师。35 73-101. ·Zbl 0136.39805号 ·doi:10.1214/aoms/1177703732
[15] Mallat,S.和Zhang,Z.(1993年)。用时间频率字典匹配追踪。IEEE传输。信号处理41 3397-3415·Zbl 0842.94004号 ·数字对象标识代码:10.1109/78.258082
[16] 鲍威尔,M.J.D.(1987)。多元插值的径向基函数:综述。《近似算法》(J.C.Mason和M.G.Cox编辑)143-167。牛津克拉伦登出版社·Zbl 0638.41001号
[17] Ratsch,G.、Onoda,T.和Muller,K.R.(1998年)。AdaBoost的利润率较低。NeuroCOLT技术报告NC-TR-98-021·Zbl 0969.68128号
[18] Ripley,B.D.(1996)。模式识别和神经网络。剑桥大学出版社·Zbl 0853.62046号
[19] Rumelhart,D.E.、Hinton,G.E.和Williams,R.J.(1986年)。通过反向传播错误来学习表示。自然323 533-536·Zbl 1369.68284号
[20] Schapire,R.和Singer,Y.(1998年)。改进了使用置信度预测的增强算法。第十一届计算学习理论年会论文集。纽约ACM·Zbl 0945.68194号 ·doi:10.1023/A:1007614523901
[21] Vapnik,V.N.(1995)。统计学习理论的本质。纽约州施普林格·Zbl 0833.62008号
[22] Warner,J.R.、Toronto,A.E.、Veasey,L.R.和Stephenson,R.(1961年)。先天性心脏病医学诊断应用数学模型。J.Amer。医学协会177 177-184。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。