跳到内容

H2O是一个开源、分布式、快速和可扩展的机器学习平台:深度学习、梯度提升(GBM)和XGBoost、随机森林、广义线性建模(GLM with Elastic Net)、K-Means、PCA、广义加法模型(GAM)、规则拟合、支持向量机(SVM)、堆叠集成、自动机器学习(AutoML)等。

许可证

h2oai/h2o-3

文件夹和文件

姓名姓名
上次提交消息
上次提交日期

最新提交

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

对于本文件或H2O-3文件,请使用:

在GitHub上询问 询问StackOverflow 询问Gitter

H2O是一个用于分布式、可扩展机器学习的内存平台。H2O使用熟悉的界面,如R、Python、Scala、Java、JSON和Flow笔记本/web界面,并与Hadoop和Spark等大数据技术无缝协作。H2O提供了许多流行的算法例如广义线性模型(GLM)、梯度提升机(包括XGBoost)、随机森林、深层神经网络、叠加集成、朴素贝叶斯、广义加性模型(GAM)、Cox比例危险、K-Means、PCA、Word2Vec以及全自动机器学习算法(H2O自动ML).

H2O是可扩展的,因此开发人员可以添加他们选择的数据转换和自定义算法,并通过所有这些客户端访问它们。H2O模型可以是已下载并加载到H2O内存中进行评分,或导出为POJO或MOJO格式以在中进行快速评分生产。有关更多信息,请参阅H2O用户指南.

H2O-3(这个储存库)是H2O的第三个化身,是过氧化氢.

目录

1.下载H2O-3

虽然大多数README是为自己构建的开发人员编写的,但大多数H2O用户只是下载并使用预构建版本。如果您是Python或R用户,安装H2O的最简单方法是通过PyPI公司水蟒(对于Python)或起重机(对于R):

蟒蛇

pip安装h2o

R(右)

安装程序包("")

有关Hadoop(或Spark/Sparkling Water)的最新稳定、夜间版本或独立H2O罐,请访问:https://h2o.ai/下载

有关下载和安装H2O的更多信息,请访问H2O用户指南.

2.开源资源

大多数人都会与三到四种主要的开源资源进行交互:github(你已经找到了),GitHub问题(用于错误报告和问题跟踪),堆栈溢出针对H2O代码/软件特定问题,以及氢气蒸汽(谷歌群组/电子邮件讨论论坛)针对不适合堆栈溢出的问题。还有一个书写器然而,为了存档和最大化可访问性,我们希望对堆栈溢出进行标准的H2O问答。

2.1问题跟踪和功能请求

您可以在我们的GitHub存储库中浏览并创建新问题:https://github.com/h2oai/h2o-3

  • 你可以浏览并搜索问题不登录Github:
    1. 单击问题页面顶部的选项卡
    2. 应用筛选器搜索特定问题
  • 收件人创造一个问题(错误或功能请求):

2.2 H2O资源清单

3.使用H2O-3工件

每个夜间构建都会将R、Python、Java和Scala工件发布到特定于构建的存储库中。特别是,您可以在maven/repo目录中找到Java工件。

下面是一个使用h2o-3作为依赖项的gradle构建文件的示例片段。用有效数字替换x、y、z和nnnn。

//h2o-3依赖信息def h2oBranch='master'def h2oBuildNumber='nnnn'def h2oProjectVersion=“x.y.z.${h2oBuildNumber}”存储库{//h2o-3依赖性马文{url“https://s3.amazonaws.com/h2o-release/h2o-3/${h2o分支}/${h2oBuildNumber}/maven/repo/“}}依赖关系{编译“ai.h2o:h2o核心:${h2o项目版本}”编译“ai.h2o:h2o-algos:${h2oProjectVersion}”编译“ai.h2o:h2o-web:${h2oProjectVersion}”编译“ai.h2o:h2o-app:${h2oProjectVersion}”}

参考最新的H2O-3排气边缘夜间构建页面有关安装夜间构建工件的信息。

请参阅水滴GitHub储存库获取如何将Java工件与gradle结合使用的工作示例。

注:稳定的H2O-3工件定期发布到Maven Central(单击此处搜索)但可能大大落后于H2O-3出血边缘夜间版本。

4.建筑H2O-3

开始开发H2O需要JDK 1.8版+,节点.js,梯度,蟒蛇R(右).我们使用Gradle包装器(称为梯度)以确保在开发目录中安装最新的本地版本的Gradle和其他依赖项。

4.1. 建造前

建筑物需要正确设置R环境所需的程序包和具有以下包的Python环境:

紧握制成表格请求

要安装这些软件包,可以使用pip(点阵)康达.如果在上安装这些软件包时遇到问题Windows(窗口),请遵循章节Windows上的安装本指南的。

(注意:建议使用一些虚拟环境,例如虚拟环境,以安装所有软件包。)

4.2. 从命令行构建(快速入门)

要从存储库构建H2O,请执行以下步骤。

配方1:克隆新的,构建,跳过测试,运行H2O

#构建H2Ogit克隆https://github.com/h2oai/h2o-3.git镉h2o-3./gradlew构建-x测试您可能会遇到问题:例如,npm丢失。安装它:brew安装npm#启动H2Ojava-jar构建/h2o.jar#将浏览器指向http://localhost:54321

方法2:克隆新测试、构建测试和运行测试(需要R的有效安装)

git克隆https://github.com/h2oai/h2o-3.git镉h2o-3./gradlew同步Smalldata./gradlew同步包./gradlew版本

注意事项:

  • 运行测试启动五个测试JVM,它们形成一个H2O集群,需要至少8GB的RAM(最好是16GB的RAM)。
  • 正在运行./gradlew同步包在Windows、OS X和Linux上受支持,强烈建议但不是必需的。./gradlew同步包确保测试和构建所需的包的预先批准版本具有完整且一致的环境。这些包可以手动安装,但我们建议设置ENV变量并使用./gradlew同步包。要设置ENV变量,请使用以下格式(其中`${WORKSPACE}可以是任何路径):
mkdir-p${WORKSPACE}/R库导出R_LIBS_USER=${WORKSPACE}/Rlibrary

诀窍3:拉动、清理、构建和运行测试

吉特拉力./gradlew同步Smalldata./gradlew同步包./gradlew清洁./gradlew版本

注意事项

  • 我们建议使用./gradlew清洁每次之后吉特拉力.

  • 通过添加跳过测试-x测试最后是gradle构建命令行。测试通常在配有4个CPU(8个超线程)和16 GB RAM的Macbook Pro笔记本电脑上运行7-10分钟。

  • 每次拉入后不需要同步smalldata,但如果测试因缺少数据文件而失败,请尝试./gradlew同步Smalldata作为第一个故障排除步骤。同步smalldata会将数据文件从AWS S3下载到工作区中的smalldata目录。同步是增量的。不要签入这些文件。smalldata目录位于.gitignore中。如果不运行任何测试,则不需要smalldata目录。

  • 正在运行./gradlew同步RPackages在Windows、OS X和Linux上受支持,强烈建议但不是必需的。./gradlew同步包确保测试和构建所需的包的预先批准版本具有完整且一致的环境。这些包可以手动安装,但我们建议设置ENV变量并使用./gradlew同步包。要设置ENV变量,请使用以下格式(其中${工作区}可以是任何路径):

    mkdir-p${WORKSPACE}/R库导出R_LIBS_USER=${WORKSPACE}/Rlibrary

秘诀4:只需构建文档

./gradlew清洁&&/gradlew build-x test&&(导出DO_FAST=1;./gradlew dist)打开target/docs-website/h2o-docs/index.html

方法5:使用Makefile构建

git存储库的根包含一个Makefile,它为开发中经常使用的构建目标提供了方便的快捷方式。要构建水罐子在跳过测试和生成替代程序集的同时,执行

制作

要构建水罐子使用最小程序集,运行

使最小

最小装配非常适合H2O机器学习算法的开发。它没有捆绑一些重量级依赖项(如Hadoop)和使用它可以节省构建时间,还可以从Maven存储库下载大型库。

4.3. Windows上的安装

步骤1:下载并安装WinPython软件.

从命令行验证蟒蛇正在使用新安装的包哪条巨蟒(或sudo哪个python).更新环境变量使用WinPython路径。

步骤2:安装所需的Python包:
pip安装夹持板轮
步骤3:安装JDK

安装Java 1.8语言+并添加适当的目录C: \程序文件\Java\jdk1.7.0_65\bin将java.exe设置为环境变量中的PATH。要确保命令提示符检测到正确的Java版本,请运行:

javac-版本

CLASSPATH变量还需要设置为JDK的lib子文件夹:

CLASSPATH=/<路径>/<到>/<jdk>/lib
步骤4。安装Node.js

安装节点.js并添加已安装的目录C: \程序文件\节点,如果尚未添加,则必须将node.exe和npm.cmd包含在PATH中。

步骤5。安装R、所需的软件包和Rtools:

安装R(右)并将bin目录添加到PATH中(如果尚未包含)。

安装以下R软件包:

要从R会话中安装这些软件包,请执行以下操作:

包装 <-c(c)("RCurl(RCurl)","jsonlite公司","随机反演","开发工具","氧气2","测试那个")对于(包装 在里面 包装) {如果(!(包装 %单位:%行名称(installed.packages()))安装包(包装)}

请注意libcurl公司安装时需要RCurl(RCurl)R包。

注意,这个包不包括运行测试,它们只用于构建H2O。

最后,安装R工具,这是一组命令行工具,用于促进Windows上的R开发。

注释:在Rtools安装期间安装Cygwin.dll。

步骤6。安装Cygwin公司

注释:在安装Cygwin期间,取消选择Python包以避免与Python.org包冲突。

步骤6b。验证Cygwin

如果已经安装了Cygwin,请删除Python包或确保在PATH变量中Native Pythons位于Cygvin之前。

步骤7。更新或验证Windows PATH变量,使其包括R、Java JDK和Cygwin。
步骤8。Git克隆水-3

如果您还没有Git客户端,请安装一个。默认值可以在此处找到http://git-scm.com/downloads。请确保在安装之前启用了命令提示符支持。

下载并更新h2o-3源代码:

git克隆https://github.com/h2oai/h2o-3
第9步。运行顶级渐变构建:
镉h2o-3./gradlew.bat版本

如果遇到错误,请使用再次运行--堆垛道有关缺少依赖项的更多说明。

4.4. OS X上的安装

如果你没有自制软件,我们建议安装它。它使OS X的包管理变得简单。

步骤1。安装JDK

安装Java 1.8语言+。要确保命令提示符检测到正确的Java版本,请运行:

javac-版本
第2步。安装Node.js:

使用自制软件:

brew安装节点

否则,请从NodeJS网站.

步骤3。安装R和所需的软件包:

安装R(右)并将bin目录添加到PATH中(如果尚未包含)。

安装以下R软件包:

要从R会话中安装这些软件包,请执行以下操作:

包装 <-c(c)("RCurl(RCurl)","jsonlite公司","随机反演","开发工具","氧气2","测试那个")对于(包装 在里面 包装) {如果(!(包装 %单位:%rownames(installed.packages()))install.packages(包装)}

请注意libcurl公司需要安装RCurl(RCurl)R包。

注意,这个包不包括运行测试,它们只用于构建H2O。

步骤4。安装python和所需的软件包:

安装python:

brew安装python

安装pip包管理器:

sudo easy_install管道

下次安装所需的软件包:

sudo pip安装轮请求列表
步骤5。Git克隆水-3

OS X应该已经安装了Git。要下载和更新h2o-3源代码:

git克隆https://github.com/h2oai/h2o-3
步骤6。运行顶级渐变构建:
镉h2o-3./gradlew版本

注意:在常规机器上运行所有测试可能需要很长时间(大约一个小时)。

如果您再次遇到错误,请使用运行--堆垛道有关缺少依赖项的更多说明。

4.5. Ubuntu 14.04上的安装

步骤1。安装Node.js
卷曲-sLhttps://deb.nodesource.com/setup_0.12| sudo bash-sudo apt-get安装-y节点
第2步。安装JDK:

安装Java 8语言。可在此处找到安装说明JDK安装。要确保命令提示符检测到正确的Java版本,请运行:

javac-版本
步骤3。安装R和所需的软件包:

可在此处找到安装说明R安装。单击“下载R for Linux”。点击“ubuntu”。按照给定的说明进行操作。

要安装所需的软件包,请按照与上述OS X的说明相同.

注释:如果进程无法在Linux上安装RStudio Server,请运行以下操作之一:

sudo apt-get安装libcurl4-openssl-dev

sudo apt-get安装libcurl4-gnutls-dev

步骤4。Git克隆水-3

如果您还没有Git客户端:

sudo apt-get安装git

下载并更新h2o-3源代码:

git克隆https://github.com/h2oai/h2o-3
步骤5。运行顶级渐变构建:
镉h2o-3./gradlew版本

如果遇到错误,请使用再次运行--堆垛道有关缺少依赖项的更多说明。

确保您不是以root身份运行,因为凉亭将拒绝这样的运行。

4.6. Ubuntu 13.10上的安装

步骤1。安装Node.js
卷曲-sLhttps://deb.nodesource.com/setup_16.x| sudo bash-sudo apt-get安装-y节点
步骤2-4。对Ubuntu 14.04(以上)执行步骤2-4

4.7. CentOS 7上的设置

光盘/光盘sudo wget--no-cookies--no-check-certificate--header“Cookie:gpw_e24=http%3A%2F%2Fww.oracle.com%2F;oraclelicense=accept-securebackup-Cookie”http://download.oracle.com/otn-pub/java/jdk/7u79-b15/jdk-7u79-linux-x64.tar.gz"sudo tar xzf jdk-7u79-linux-x64.tar.gz光盘jdk1.7.0_79sudo替代方案——安装/usr/bin/java-java/opt/jdk1.7.0_79/bin/java 2sudo备选方案--安装/usr/bin/jar-jar/opt/jdk1.7.0_79/bin/jar 2sudo替代方案--安装/usr/bin/javac-javac/opt/jdk1.7.0_79/bin/javac 2sudo备选方案--设置jar/opt/jdk1.7.0_79/bin/jarsudo备选方案--设置javac/opt/jdk1.7.0_79/bin/javac光盘/光盘sudo wget公司http://dl.fedoraproject.org/pub/epel/7/x86_64/epel-release-7-5.noarch.rpmsudo rpm-ivh epel版本-7-5.noarch.rpmsudo-echo“multilib_policy=best”>>/etc/yum.confsudo yum-y更新sudo yum-y安装R R-devel git python-pip openssl-devel-devel libxml2-devel-libcurl-devel gcc-c++生成openssl-devel内核级别texlive texinfo texlive-latex-fonts libX11-devel mesa-libGL-devel mesa-libGL-devel nodejs npm python-evel numpy scipy python-pandasudo pip安装scikit-learn抓地力制表statsmodels轮mkdir~/R库导出JAVA_HOME=/opt/jdk1.7.0_79导出JRE_HOME=/opt/jdk1.7.0_79/JRE导出PATH=$PATH:/opt/jdk1.7.0_79/bin:/opt/jdk1.7.01_79/jre/bin导出R_LIBS_USER=~/Rlibrary#安装本地R包R-e’install.packages(c(“RCurl”,“jsonlite”,“statmod”,“devtools”,“roxygen2”,“testtat”),dependencies=TRUE,repos=“http://cran.rstudio.com/")'光盘git克隆https://github.com/h2oai/h2o-3.git镉h2o-3#构建H2O./gradlew同步Smalldata./gradlew同步包./gradlew构建-x测试

5.建筑后下水

要在本地启动H2O集群,请在命令行上执行以下操作:

java-jar构建/h2o.jar

可用启动JVM和H2O选项列表(例如。-圣诞节,-n个读数,-知识产权),在中可用H2O用户指南.

6.在Hadoop上构建H2O

预先构建的H2O-on-Hadoop zip文件可在下载页面。每个Hadoop发行版在h2o-3中都有一个单独的zip文件。

要使用Hadoop支持自行构建H2O,请首先安装python的sphinx:pip安装狮身人面像然后,通过从顶级h20-3目录中输入以下内容开始构建:

导出BUILD_HADOOP=1;./gradlew构建-x测试;./gradlew距离;

这将创建一个名为“target”的目录,并在那里生成zip文件。请注意构建_ HADOOP是用户名为詹金斯(请参阅设置.等级); 否则,您必须请求它,如上所示。

要只为选定的发行版构建zip文件,请使用H2O_目标env变量与构建_ HADOOP,例如:

导出BUILD_HADOOP=1;导出H2O_TARGET=hdp2.5,hdp2.6./gradlew构建-x测试;./gradlew距离;

添加对Hadoop新版本的支持

水-hadoop目录中,每个Hadoop版本都有一个用于驱动程序的构建目录和一个用于fatjar的汇编目录。

您需要:

  1. 添加新的驱动程序目录和程序集目录(每个目录都有一个建筑梯度文件)中水-hadoop
  2. 将这些新项目添加到h2o-3/设置等级
  3. 将新Hadoop版本添加到HADOOP_版本在里面make-dist.sh品牌
  4. 将新Hadoop版本添加到中的列表h2o-dist/buildinfo.json

安全的用户模拟

Hadoop支持安全用户模拟通过其Java API。可以允许kerberos身份验证用户代理满足NameNode的core-site.xml文件中输入的指定条件的任何用户名。此模拟仅适用于与Hadoop API或支持它的Hadoop相关服务的API的交互(这与在源机器上切换到该用户不同)。

设置安全的用户模拟(针对h2o):

  1. 创建或找到一个id用作代理,该代理被限制为无法访问HDFS或相关服务;代理用户只需要用来模拟用户
  2. (如果不使用h2odriver,则必需)如果您不使用驱动程序(例如,您使用Hadoop针对h2o的API编写了自己的代码),请进行必要的代码更改以模拟用户(请参阅org.apache.hadoop.security。用户组信息)
  3. 在Ambari/Cloudera Manager中或直接在NameNode的core-site.xml文件中,为希望用作代理的用户添加2/3属性(替换为简单用户名,而不是完全限定的主体名称)。
    • hadoop.proxyuser<代理用户名>.hosts:允许代理用户代表来自的有效用户执行模拟操作的主机
    • hadoop.proxyuser<代理用户名>.groups:模拟用户必须属于的组,以便模拟与该代理用户一起工作
    • hadoop.proxyuser<代理用户名>.users:允许代理用户模拟的用户
    • 示例:<property><name>hadoop.proxyuser.myproxyuser.hosts</name><value>host1,host2</value></property><property><name>hadoop.proxyuser.myproxyuser.groups</name><value>group1,group2</value>
  4. 重启HDFS和YARN等核心服务以使更改生效

可以在HDFS审计日志中查看模拟的HDFS操作(“auth:PROXY”应出现在ugi公司=适用的条目中的字段)。同样,YARN应该在资源管理器UI的某个位置显示“auth:PROXY”。

要对h2o的Hadoop驱动程序使用安全模拟,请执行以下操作:

在尝试此操作之前,请参阅下面的模拟风险

使用h2odriver时(例如,使用hadoop jar。。。),指定-主体<代理用户kerberos主体>,-keytab<代理用户keytab路径>、和-run_as_user<要模拟的hadoop用户名>,以及所需的任何其他参数。如果配置成功,代理用户将登录并模拟-运行_用户只要用户或组配置属性(上述配置)允许该用户;这是由HDFS&YARN执行的,而不是h2o的代码。驱动程序有效地将其安全上下文设置为模拟用户,以便所有受支持的Hadoop操作都将以该用户的身份执行(例如,YARN、HDFS API支持安全模拟用户,但其他用户可能不支持)。

利用安全模拟时要采取的预防措施

  • 安全模拟的目标用例是预先验证用户身份,然后代表该用户使用h2odriver(在本例中)的应用程序或服务。H2O的Steam就是一个完美的例子:通过SSL在web应用程序中验证用户,在创建H2O YARN容器时模拟该用户。
  • 代理用户在Hadoop集群中应该具有有限的权限;这意味着没有访问数据或进行API调用的权限。通过这种方式,如果它受到威胁,它将只能模拟集群中的特定用户子集,并且只能模拟来自特定机器的用户。
  • 使用hadoop.proxyuser<代理用户名>.hosts尽可能或切实可行的财产。
  • 不要将proxyusername的密码或keytab提供给任何不想冒充其他用户的用户(这通常是任何用户)。模拟的目的是不允许用户相互模拟。有关典型用例,请参阅第一个项目符号。
  • 只要可行,就限制用户登录正在进行代理的计算机。
  • 确保用于登录代理用户的keytab得到了适当的保护,并且用户不能以该id登录(通过例如)
  • 永远不要设置hadoop.proxyuser。。{users,groups}到“*”或“hdfs”、“yarn”等。允许任何用户模拟hdfs、yarn或任何其他重要用户/组时应格外小心强烈地在允许之前进行分析。

安全模拟的风险

  • 执行模拟的id可能会像其他任何用户id一样受到威胁。
  • 设置任何hadoop.proxyuser<代理用户名>。{主机、组、用户}属性设置为“*”会大大增加安全风险。
  • 如果用户在使用驱动程序之前没有经过身份验证(例如,Steam通过安全的web应用程序/API进行身份验证),则很难对进程/系统进行审计。
$git差异diff—git a/h2o-app/build.gradle b/h2o-app/build.gratle索引af3b929..097af85 100644---a/h2o-app/build.gradle公司+++b/h2o-app/build.gradle公司@@-8,5+8,6@@依赖项{编译项目(“:h2o-algos”)编译项目(“:h2o-core”)编译项目(“:h2o-genmodel”)+编译项目(“:h2o-persist-hdfs”)}diff—git a/h2o-persist-hdfs/build.gradle b/h2o-perstist-hdfs/build.jradle索引41b96b2..6368ea9 100644---a/h2o-persist-hdfs/build.gradle公司+++b/h2o持久性hdfs/build.gradle@@-2,5+2,6@@description=“H2O持久HDFS”依赖关系{编译项目(“:h2o核心”)-编译(“org.apache.hadoop:hadoop-client:2.0.0-cdh4.3.0”)+编译(“org.apache.hadoop:hadoop-client:2.4.1-mapr-1408”)+编译(“org.json:org.json:chargebee-1.0”)}

7.起泡水

Sparkling Water结合了两种开源技术:Apache Spark和H2O机器学习平台。它使H2O的高级算法库,包括深度学习、GLM、GBM、K-Means和分布式随机森林,可以从Spark工作流访问。Spark用户可以从任一平台中选择最佳功能,以满足其机器学习需求。用户可以将Spark的RDD API和Spark MLLib与H2O的机器学习算法相结合,或者独立于Spark使用H2O进行建模过程,并在Spark中对结果进行后处理。

起泡水资源:

8.文件

文档主页

H2O的主要文件是H2O用户指南.访问http://docs.h2o.ai对于H2O项目文档的顶级介绍。

生成REST API文档

要生成REST API文档,请使用以下命令:

cd~/h2o-3cd-py光盘巨蟒/generate_rest_api_docs.py#仅生成降价巨蟒/generate_rest_api_docs.py--generate_html--github_user github_user--github_password github_password#生成降价和html

生成的文档的默认位置是构建/docs/REST.

如果构建失败,请尝试梯度清洁,然后git清洁-f.

出血边缘构建文档

每个出血边缘夜间构建的文档都可以在夜间构建页面.

9.引用H2O

如果您在出版物中使用H2O作为工作流的一部分,请使用以下BibTex条目引用您的H2O资源:

H2O软件

@手动{h2o_package_or_module,title={package_or_module_title},作者={H2O.ai},年份={year},month={month},注意={version_information},url={resource_url},}

格式化H2O软件引用示例:

H2O手册

H2O算法手册可在文档主页.

@手册{h2o_booklet_name,title={booklet_title},author={list_of_authors},年份={year},month={month},url={link_url},}

格式化小册子引用示例:

Arora,A.,Candel,A.、Lanford,J.、LeDell,E.和Parmar,V.(2016年10月)。H2O深度学习.http://docs.h2o.ai/h2o/latest-stable/h2o-docs/booklets/DeepLearningBooklet.pdf.

Click,C.、Lanford,J.、Malohlava,M.、Parmar,V.和Roark,H.(2016年10月)。含H2O的梯度增强模型.http://docs.h2o.ai/h2o/latest-stable/h2o-docs/booklets/GBMBooklet.pdf.

10.社区

多年来,H2O已经由H2O.ai(公司)和更大的开源社区中的许多贡献者构建。你可以通过回答开始贡献H2O堆栈溢出问题或提交错误报告。请加入我们!

团队和委员会

斯里萨蒂斯·安巴蒂悬崖点击汤姆·克拉杰维奇托马斯·尼科德姆米查尔·马洛拉发凯文·诺莫耶斯宾塞·艾罗安琪·福尼迪·梅塔阿诺·坎德尔约瑟芬·王王欣马克斯·施洛默雷·佩克普里特维·帕布布兰登·希尔杰夫·甘贝拉阿里尔·拉奥维拉杰·帕马尔肯达尔·哈里斯阿南德·阿瓦蒂杰西卡·兰福德亚历克斯·特莱斯艾利森·沃什本王欣埃里克·埃克斯特兰德Neeraja Madabhushi公司塞巴斯蒂安·维迪里奥本·萨布林马特·道尔马克·兰德里埃林·勒德尔安德烈·斯皮里多诺夫奥列格·罗根斯基尼克·马丁南希·乔丹Nishant Kalonia公司纳丁·胡萨米杰夫·克莱默Stacie Spreitzer公司维诺德·艾扬格查伦·温多姆帕拉格·桑哈维Navdeep吉尔劳伦·迪佩纳安莫尔·巴尔马克·陈尼克·卡尔波夫阿夫尼·瓦德瓦阿什里斯·巴楚凯伦·海勒普蒂安周若菲德米特里·拉科布兰登·默里雅库布·哈瓦文凡马格努斯·斯坦斯莫帕沙·斯特森科安吉拉·巴茨马特乌斯·戴姆齐克(Mateusz Dymczyk)迈卡·斯塔布斯常春藤·王Terone病房利兰·威尔金森医生王迪尼基尔·谢哈尔帕维尔·普舍伊德米查尔·库尔卡维罗妮卡·毛雷罗娃简·斯特巴扬·詹德鲁萨克塞巴斯蒂安·波里埃托马什·弗里达阿尔德·凯尔门迪尤利娅·西松亚当·瓦伦塔马雷克·诺沃特尼

顾问

科学咨询委员会

斯蒂芬·博伊德罗布·蒂布什拉尼黑斯蒂

系统、数据、文件系统和Hadoop

道格利克里斯·波利奥德鲁巴·博塔库尔

投资者

Jishnu Bhattacharjee,Nexus Venture Partners公司阿南德·巴布围手术期阿纳德·拉贾拉曼阿什·巴德瓦吉拉凯什·马图尔迈克尔·马克斯埃格伯特·比尔曼拉杰什·安巴蒂

关于

H2O是一个开源、分布式、快速和可扩展的机器学习平台:深度学习、梯度提升(GBM)和XGBoost、随机森林、广义线性建模(GLM with Elastic Net)、K-Means、PCA、广义加法模型(GAM)、规则拟合、支持向量机(SVM)、堆叠集成、自动机器学习(AutoML)等。

话题

资源

许可证

安全政策

星星

观察者

叉子

包装

未发布包