研究论文

MLStar：机器学习程序综合系统

作者：
加布里埃尔·科皮托

美国圣克拉拉PerformanceStar

美国圣克拉拉PerformanceStar

https://orcid.org/0000-0003-2282-6113
查看配置文件

,
乔纳森·施瓦茨

美国圣克拉拉PerformanceStar

美国圣克拉拉PerformanceStar

https://orcid.org/0000-0003-2203-9814
查看配置文件

,
朱利安·安布拉德

美国圣克拉拉PerformanceStar

美国圣克拉拉PerformanceStar

https://orcid.org/0000-0002-7072-9281
查看配置文件

,
罗伯特·菲尔曼

美国圣克拉拉PerformanceStar

美国圣克拉拉PerformanceStar

https://orcid.org/0000-0002-9566-5341
查看配置文件

,
兰登·拉伯恩

美国圣克拉拉PerformanceStar

美国圣克拉拉PerformanceStar

https://orcid.org/0000-0002-8075-6806
查看配置文件

作者信息和声明

GECCO’23伴侣：遗传和进化计算伴侣会议记录2023年7月第1721-1726页https://doi.org/10.1145/3583133.3596367

出版：2023年7月24日出版历史

GECCO’23伴侣：遗传和进化计算伴侣会议记录

第1721-1726页

摘要

本文介绍了我们的自动ML系统MLStar，它使用遗传编程创建scikit-learn和基于Keras的Python程序来执行监督学习。MLStar利用了我们自己的遗传编程系统（GPStar4），与传统的遗传编程框架相比，它提供了更大的搜索空间。

实现MLStar性能的关键要素包括将个人表示为有向非循环图（DAG），一个用于塑造生成的各种图的丰富类型系统，用于DAG结构的新型遗传算子，以及通过Optuna超参数优化框架进行的高级超参数调整。MLStar还提供多目标适合性和多种复杂人群类型。

我们表明，MLStar在基准测试中的表现优于其他几个auto-ML框架。我们还证明，MLStar即使在运行时禁用计算昂贵的功能，也能够提供具有竞争力的解决方案。

工具书类

2023.自动。https://github.com/ClimbsRocks/auto_ml谷歌学者
秋叶拓哉、三野昭太郎、延濑敏彦、大田武夫和小山正男。2019.Optuna:下一代超参数优化框架。In第25届ACM SIGKDD知识发现和数据挖掘国际会议论文集。谷歌学者数字图书馆
詹姆斯·伯格斯特拉（James Bergstra）、丹尼尔·亚明斯（Daniel Yamins）和大卫·考克斯（David Cox）。2013.建立模型搜索科学：视觉架构数百维超参数优化。在第30届机器学习国际会议论文集（机器学习研究论文集，第28卷）Sanjoy Dasgupta和David McAllester（编辑）。美国佐治亚州亚特兰大市PMLR，115-123。https://proceedings.mlr.press/v28/bergstra13.html谷歌学者
陈田琪（Tianqi Chen）和卡洛斯·盖斯特林（Carlos Guestrin），2016年。XGBoost：一个可扩展的树增强系统。在第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集（美国加利福尼亚州旧金山）（KDD’16）.ACM，美国纽约州纽约市，785--794。谷歌学者数字图书馆
Francois Chollet等人，2015年。凯拉斯。https://github.com/fchollet/keras谷歌学者
Piali Das、Nikita Ivkin、Tanya Bansal、Laurence Rouesnel、Philip Gautier、Zohar Karnin、Leo Dirac、Lakshmi Ramakrishnan、Andre Perunicic、Iaroslav Shcherbatyi、Wilton Wu、Aida Zolic、Huibin Shen、Amr Ahmed、Fela Winkelmolen、Miroslav Miladinovic、Cedric Archembeau、Alex Tang、Bhaskar Dutt、Patricia Grao和Kumar Venkateswar。2020年，亚马逊SageMaker Autopilot：大规模的白盒AutoML解决方案。在第四届端到端机器学习数据管理国际研讨会会议记录（俄勒冈州波特兰，美国）（DEEM'20）美国纽约州纽约市计算机协会，第2条，共7页。谷歌学者数字图书馆
马蒂亚斯·费勒（Matthias Feurer）、亚伦·克莱恩（Aaron Klein）、凯萨琳娜·艾根斯佩格（Katharina Eggensperger）、约斯特·斯普林伯格（Jost Springenberg）、曼努埃尔·布鲁姆（Manuel Blum）和弗兰克·赫特。2015.高效稳健的自动机器学习。在神经信息处理系统进展28（2015）. 2962--2970.谷歌学者数字图书馆
金海峰、宋清泉和胡霞，2019年。Auto-Keras：一个高效的神经架构搜索系统。在第25届ACM SIGKDD知识发现与数据挖掘国际会议论文集（安克雷奇，阿拉斯加州，美国）（KDD’19）美国纽约州纽约市计算机协会，1946年至1956年。谷歌学者数字图书馆
加布里埃尔·科皮托·朱利安·安布拉德（Gabriel Kopito Julien Amblard），罗伯特·菲尔曼（Robert Filman）。2023.GPStar4：遗传编程实验的灵活框架。提交给GECCO 2023。谷歌学者数字图书馆
詹姆斯·马克斯·坎特（James Max Kanter）和卡尔扬·维拉马查尼（Kalyan Veeramachaneni）。2015.深度特征合成：走向自动化数据科学工作。2015 IEEE数据科学和高级分析国际会议（DSAA）（2015），1-10。谷歌学者交叉引用
唐纳德·E·克努思。1968.上下文无关语言的语义。数学。系统。理论2, 2 (1968), 127--145.谷歌学者交叉引用
埃林·勒德尔和塞巴斯蒂安·波里埃。2020年，H2O AutoML：可扩展的自动机器学习。第七届ICML自动机器学习研讨会（AutoML）（2020年7月）。https://www.automl.org/wp-content/uploads/2020/07/automl_2020_paper_61.pdf谷歌学者
埃德加·加尔瓦恩·洛佩斯和卡蒂亚·罗德里格斯-巴斯克斯。2007.一棵树中的多个交互输出：实证调查。在2007年4月11日至13日，西班牙巴伦西亚，第十届欧洲遗传编程会议，EuroGP 2007，会议记录（计算机科学讲稿，第4445卷）马克·埃布纳（Marc Ebner）、迈克尔·奥尼尔（Michael O'Neill）、阿尼科·埃卡特（AnikóEkárt）、莱昂纳多·范内斯基（Leonardo Vanneschi）和安娜·埃斯帕西亚·阿尔卡扎尔（Anna Esparcia-Alcáza。施普林格，341--350。谷歌学者交叉引用
Randal S.Olson、Nathan Bartley、Ryan J.Urbanowicz和Jason H.Moore。2016.自动化数据科学的基于树的管道优化工具评估。谷歌学者交叉引用
Randal S.Olson、William La Cava、Patryk Orzechowski、Ryan J.Urbanowicz和Jason H.Moore。2017.PMLB：用于机器学习评估和比较的大型基准套件。生物数据挖掘10、36（2017年12月11日），1-13。谷歌学者交叉引用
迈克尔·奥尼尔。2009年，里卡多·波利（Riccardo Poli）、威廉·B·兰登（William B.Langdon）、尼古拉斯·麦克菲（Nicholas F.McPhee）：《遗传编程实地指南：露露》（The Field Guide to Genetic Programming:Lulu）。com，2008年，250页，ISBN 978-1-4092-0073-4。谷歌学者
F.Pedregosa、G.Varoqueaux、A.Gramfort、V.Michel、B.Thirion、O.Grisel、M.Blondel、P.Prettenhofer、R.Weiss、V.Dubourg、J.Vanderplas、A.Passos、D.Cournapeau、M.Brucher、M.Perrot和E.Duchesnay。2011.Scikit-learn：Python中的机器学习。机器学习研究杂志12 (2011), 2825--2830.谷歌学者数字图书馆
刘德米拉·普罗霍伦科娃（Liudmila Prokhorenkova）、格列布·古塞夫（Gleb Gusev）、阿列克桑德·沃罗贝夫（Aleksandr Vorobev）、安娜·维罗妮卡·多洛古什（Anna Veronika Dorogush）和安德烈·古林。2018.CatBoost：无偏见的助推，具有分类功能。在神经信息处理系统研究进展、S.Bengio、H.Wallach、H.Larochelle、K.Grauman、N.Cesa-Bianchi和R.Garnett（编辑），第31卷。Curran Associates公司。https://proceedings.neurips.cc/paper/2018/file/14491b756b3a51daac41c24863285549-paper.pdf谷歌学者
莱奥·弗朗索索·D·P·索托、保罗·考夫曼、蒂莫西·阿特金森、罗曼·卡尔克鲁斯和马尔西奥·波尔托·巴斯加洛普。2020年，遗传编程图形表示研究。在2020年遗传和进化计算会议记录（墨西哥坎昆）（GECCO’20）美国纽约州纽约市计算机协会，931--939。谷歌学者数字图书馆
尹光耀和理查德·约翰逊。2000.一系列新的权力转换，以改善常态或对称性。生物特征87, 4 (12 2000), 954--959. arXiv公司：https://academic.oup.com/biomet/article-pdf/87/4/954/63321/870954.pdf谷歌学者交叉引用

索引术语

MLStar：机器学习程序综合系统
1. 计算方法
  1. 机器学习
    1. 机器学习方法
      1. 生物激励方法
        遗传编程

建议

关于寻找最优多叉树

我们研究了在给定节点集上寻找有向无环图（DAG）以最大化给定的评分函数的NP-hard问题。该问题模拟了从数据推断概率网络的任务，该任务在。。。
阅读更多信息
有向非循环图的堆栈和队列布局：第一部分

无向图的堆栈布局和队列布局已被用于建模容错计算和并行进程调度中的问题。然而，并行进程调度中的问题可以通过堆栈和队列布局更准确地建模。。。
阅读更多信息
学习贝叶斯网络分类器：在部分有向非循环图空间中搜索

人们普遍认为，用于学习非限定类型贝叶斯网络的算法，尤其是基于分数+搜索范式的算法，不适合构建基于竞争贝叶斯网的分类器。几个。。。
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

发布于
GECCO’23伴侣：遗传和进化计算伴侣会议记录
2023年7月
2519页
国际标准图书编号：9798400701207
DOI（操作界面）：2014年10月14日/3583133
主席：
萨拉·席尔瓦,
项目主席：
路易斯·帕奎特
版权所有©2023 ACM
如果复制品不是为了盈利或商业利益而制作或分发的，并且复制品的第一页载有本通知和完整引文，则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布，在服务器上发布或重新发布到列表，需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].
赞助商
合作中
出版商
计算机协会
美国纽约州纽约市
出版历史
- 出版：2023年7月24日
权限
请求有关此文章的权限。
请求权限

检查更新
作者标记
遗传程序设计
有向非循环图
科学基础学习
自动-ML
限定符
- 研究论文
会议

接受率
总体验收率1,669属于4,410提交文件，38%
即将召开的会议
GECCO’24

赞助商：

西格沃

遗传和进化计算会议

2024年7月14日至18日

墨尔本，维多利亚州，澳大利亚
资金来源
其他指标
查看文章指标

文章指标
- 1
  引用总数
  查看引文
- 32
  总下载次数
- 下载次数（过去12个月）32
- 下载次数（最近6周）三
其他指标
查看作者指标
引用人
查看全部

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

MLStar：机器学习程序综合系统

GECCO’23伴侣：遗传和进化计算伴侣会议记录

摘要

工具书类

引用人

索引术语

建议

关于寻找最优多叉树

有向非循环图的堆栈和队列布局：第一部分

学习贝叶斯网络分类器：在部分有向非循环图空间中搜索

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

权限

检查更新

作者标记

限定符

会议

接受率

即将召开的会议

资金来源

其他指标

文章指标

其他指标

引用人

PDF格式

电子阅读器

数字版

解说词

MLStar：机器学习程序综合系统

GECCO’23伴侣：遗传和进化计算伴侣会议记录

摘要

工具书类

引用人

索引术语

建议

关于寻找最优多叉树

有向非循环图的堆栈和队列布局：第一部分

学习贝叶斯网络分类器：在部分有向非循环图空间中搜索

评论

登录选项

完全访问权限

发布于

赞助商

合作中

出版商

出版历史

权限

检查更新

作者标记

限定符

会议

接受率

即将召开的会议

资金来源

文章指标

其他指标

PDF格式

电子阅读器

数字版

共享此出版物链接

在社交媒体上分享