马赛罗

R包HORSELULL:具有规则结构马蹄正则化的树集合。我们提出了一个新的贝叶斯模型用于灵活的非线性回归和分类使用树集成。该模型是基于弗里德曼和波佩斯库的规则规则方法[AN]。APPLSt.2(2008)916—954)在L1正则回归中使用决策树和线性项的规则。我们修改RuleFIT通过替换马蹄前的L1正则化,这是众所周知的,以提供积极的噪声预测器收缩,同时留下重要的信号基本上未被触动。当大量规则被用作预测因子时,这一点尤其重要,因为它们中的许多规则只贡献噪声。我们的马蹄前有一个额外的层次层,它应用更多的收缩先验规则与大量的分裂,以及规则,只满足少数观察。我们先前的侵略性噪声收缩也使得有可能补充规则的规则从一个额外的一组树木从规则森林,这带来了合意的多样性。我们从后验分布样本使用非常有效和易于实现的吉布斯采样器。在16个数据集上,新模型显示出优于最先进的方法,如RuleFIT、BART和随机森林。该模型及其解释是众所周知的波士顿住房数据,以及基因表达数据的癌症分类。后验抽样,预测和图形工具解释模型结果在一个公开的可用的$T R $包中实现。