跳到内容

Xtra-计算/雷电

存储库文件导航

文档状态 GitHub许可证 GitHub问题 PyPI版本 下载

文件|安装|参数|Python(scikit-learn)接口

有什么新功能?

ThunderGBM获得了IEEE计算机学会出版委员会颁发的2019年IEEE Transactions on Parallel and Distributed Systems最佳论文奖“Zeyi Wen,Jiashuai Shi*,Bingsheng He,Jian Chen,Kotagiri Ramamohanarao,and Qinbin Li*,利用GPU进行高效梯度提升决策树训练,IEEE并行和分布式系统汇刊,第30卷,第12期,2019年,第2706-2717页。”)。查看更多详细信息:IEEE最佳论文奖获得者,新加坡国立大学计算机学院新闻

概述

ThunderGBM的任务是帮助用户轻松高效地应用GBDT和Random Forests来解决问题。ThunderGBM利用GPU实现高效率。ThunderGBM的主要功能如下。

  • 通常是其他库的10倍。
  • 支持Python(scikit-learn)接口。
  • 支持的操作系统:Linux和Windows。
  • 支持分类、回归和排名。

为什么加速GBDT和随机森林:A调查Kaggle于2017年进行的研究表明,50%、46%和24%的数据挖掘和机器学习实践者分别是决策树、随机森林和GBM的用户。

GBDT和Random Forests通常用于创建最先进的数据科学解决方案。我们在下面列出了三个使用GBDT的成功解决方案。请查看XGBoost网站以获得更多成功的解决方案和用例。以下是GDBT和Random Forests的一些成功例子:

入门

前提条件

  • cmake 2.8或以上
    • gcc 4.8或更高版本(Linux)|CUDA公司9或以上
    • Visual C++for Windows | CUDA 10

快速安装

  • 对于带有CUDA 9.0的Linux

    • pip安装thundergbm
  • 对于Windows(64位)

    • 下载Python轮子文件(适用于Python3或更高版本)

    • 安装Python轮子文件

      • pip安装thundergbm-0.3.4-py3-none-win_amd64.whl
  • 目前仅支持python3

  • 安装thundergbm后,可以通过以下方式导入和使用分类器(类似于回归量):

 雷鸣(thundergbm) 进口 TGBM分类器
氯氟化碳 = TGBM分类器()氯氟化碳.适合(x个,)

从源生成

git克隆https://github.com/zeyiwen/threngbm.git光盘雷鸣(thundergbm)#在thundergbm目录下git子模init-cub&&git子模块更新

在Linux上构建(构建说明窗户)

#在thundergbm目录下mkdir生成&& 光盘建造&&cmake。。&&品牌-j

快速入门

./bin/threngbm-train/数据集/机器.conf./bin/thurrengbm-predict/数据集/机器.conf

你会看到的RMSE=0.489562成功运行后。

苹果不支持MacOS悬挂式支架对于一些NVIDIA GPU。我们将根据用户社区的反馈考虑支持MacOS。请继续关注。

如何引用ThunderGBM

如果你在论文中使用ThunderGBM,请引用我们的工作(TPDS公司JMLR公司).

@第{8727750条,作者={Z.{Wen}和J.{Shi}以及B.{He}和J{Chen}以及K.{Ramamohanarao}和Q.{Li}},journal={IEEE并行和分布式系统事务},title={利用GPU进行高效梯度增强决策树训练},年份={2019},体积={30},数字={12},页码={2706-2717},}@文章{wenthrengbm19,作者={文、泽一和石、家帅和何、炳生和李、秦斌和陈、建},title={{ThunderGBM}:{GPUs}}上的快速{GBDTs}和随机森林,journal={机器学习研究杂志},体积={21},年份={2020年}}

相关论文

  • Wen Zeyi、Shi Jiashuai、He Bingsheng、Chen Jian、Kotagiri Ramamohanarao和Li Qinbin。利用GPU进行高效梯度提升决策树训练。IEEE并行和分布式系统交易(TPDS),2019年5月接受。pdf格式

  • 温泽毅、刘汉峰、石家帅、李钦斌、何炳生、陈健。ThunderGBM:GPU上的快速GBDT和随机森林。在JMLR MLOSS(机器学习开源软件)上发布。年份:2020年,第21卷,第108期,页码:1-5。pdf格式

  • 温泽毅、何炳生、科塔吉里·拉马莫哈纳罗、卢圣良、石家帅。基于GPU的高效梯度增强决策树训练。第32届IEEE实习生国家并行和分布式处理研讨会(IPDPS),第234-243页,2018年。pdf格式

ThunderGBM的主要成员

  • 泽毅文,NUS(现就读于西澳大利亚大学)
  • 刘汉峰,广东财经大学(新加坡国立大学访问生)
  • 四川理工大学(新加坡国立大学访问学生)Jiashuai Shi
  • 国立大学李钦斌
  • 顾问:何炳生,新加坡国立大学
  • 合作方:陈健(SCUT)

其他信息

  • 这项工作得到了MoE AcRF Tier 2赠款(MOE2017-T2-1-122)和新加坡NUS创业赠款的支持。

相关库