-
目前,我们缺乏标准化、易于访问的任务(数据集)基准测试套件,这些任务(数据集中)旨在反映重要的问题领域、实用性和足够的挑战性,以支持对性能结果的严格分析。 -
问题定义中的细微差异,例如超参数搜索空间的设计或时间预算的定义方式,可以极大地改变任务的难度。 这一问题使得复制已发表的研究和比较不同论文的结果变得困难。
基准测试数据集的固化套件 开放多媒体程序库 ( 回归,回归 , 分类 ). 包括一些基准测试代码 流行的AutoML系统 回归和分类任务。 可以添加新的AutoML系统 实验可以在Docker或Singularity容器中运行 在本地或AWS上执行实验