跳到主要内容
10.1145/3583133.3596367acm会议文章/章节视图摘要出版物页面灰泥会议记录会议集合
研究论文

MLStar:机器学习程序综合系统

出版:2023年7月24日出版历史

摘要

本文介绍了我们的自动ML系统MLStar,它使用遗传编程创建scikit-learn和基于Keras的Python程序来执行监督学习。MLStar利用了我们自己的遗传编程系统(GPStar4),与传统的遗传编程框架相比,它提供了更大的搜索空间。

实现MLStar性能的关键要素包括将个人表示为有向非循环图(DAG),一个用于塑造生成的各种图的丰富类型系统,用于DAG结构的新型遗传算子,以及通过Optuna超参数优化框架进行的高级超参数调整。MLStar还提供多目标适合性和多种复杂人群类型。

我们表明,MLStar在基准测试中的表现优于其他几个auto-ML框架。我们还证明,MLStar即使在运行时禁用计算昂贵的功能,也能够提供具有竞争力的解决方案。

工具书类

  1. 2023.自动。https://github.com/ClimbsRocks/auto_ml谷歌学者谷歌学者
  2. 秋叶拓哉、三野昭太郎、延濑敏彦、大田武夫和小山正男。2019.Optuna:下一代超参数优化框架。In第25届ACM SIGKDD知识发现和数据挖掘国际会议论文集。谷歌学者谷歌学者数字图书馆数字图书馆
  3. 詹姆斯·伯格斯特拉(James Bergstra)、丹尼尔·亚明斯(Daniel Yamins)和大卫·考克斯(David Cox)。2013.建立模型搜索科学:视觉架构数百维超参数优化。第30届机器学习国际会议论文集(机器学习研究论文集,第28卷)Sanjoy Dasgupta和David McAllester(编辑)。美国佐治亚州亚特兰大市PMLR,115-123。https://proceedings.mlr.press/v28/bergstra13.html谷歌学者谷歌学者
  4. 陈田琪(Tianqi Chen)和卡洛斯·盖斯特林(Carlos Guestrin),2016年。XGBoost:一个可扩展的树增强系统。第22届ACM SIGKDD知识发现和数据挖掘国际会议论文集(美国加利福尼亚州旧金山)(KDD’16).ACM,美国纽约州纽约市,785--794。谷歌学者谷歌学者数字图书馆数字图书馆
  5. Francois Chollet等人,2015年。凯拉斯。https://github.com/fchollet/keras谷歌学者谷歌学者
  6. Piali Das、Nikita Ivkin、Tanya Bansal、Laurence Rouesnel、Philip Gautier、Zohar Karnin、Leo Dirac、Lakshmi Ramakrishnan、Andre Perunicic、Iaroslav Shcherbatyi、Wilton Wu、Aida Zolic、Huibin Shen、Amr Ahmed、Fela Winkelmolen、Miroslav Miladinovic、Cedric Archembeau、Alex Tang、Bhaskar Dutt、Patricia Grao和Kumar Venkateswar。2020年,亚马逊SageMaker Autopilot:大规模的白盒AutoML解决方案。第四届端到端机器学习数据管理国际研讨会会议记录(俄勒冈州波特兰,美国)(DEEM'20)美国纽约州纽约市计算机协会,第2条,共7页。谷歌学者谷歌学者数字图书馆数字图书馆
  7. 马蒂亚斯·费勒(Matthias Feurer)、亚伦·克莱恩(Aaron Klein)、凯萨琳娜·艾根斯佩格(Katharina Eggensperger)、约斯特·斯普林伯格(Jost Springenberg)、曼努埃尔·布鲁姆(Manuel Blum)和弗兰克·赫特。2015.高效稳健的自动机器学习。神经信息处理系统进展28(2015). 2962--2970.谷歌学者谷歌学者数字图书馆数字图书馆
  8. 金海峰、宋清泉和胡霞,2019年。Auto-Keras:一个高效的神经架构搜索系统。第25届ACM SIGKDD知识发现与数据挖掘国际会议论文集(安克雷奇,阿拉斯加州,美国)(KDD’19)美国纽约州纽约市计算机协会,1946年至1956年。谷歌学者谷歌学者数字图书馆数字图书馆
  9. 加布里埃尔·科皮托·朱利安·安布拉德(Gabriel Kopito Julien Amblard),罗伯特·菲尔曼(Robert Filman)。2023.GPStar4:遗传编程实验的灵活框架。提交给GECCO 2023。谷歌学者谷歌学者数字图书馆数字图书馆
  10. 詹姆斯·马克斯·坎特(James Max Kanter)和卡尔扬·维拉马查尼(Kalyan Veeramachaneni)。2015.深度特征合成:走向自动化数据科学工作。2015 IEEE数据科学和高级分析国际会议(DSAA)(2015),1-10。谷歌学者谷歌学者交叉引用交叉引用
  11. 唐纳德·E·克努思。1968.上下文无关语言的语义。数学。系统。理论2, 2 (1968), 127--145.谷歌学者谷歌学者交叉引用交叉引用
  12. 埃林·勒德尔和塞巴斯蒂安·波里埃。2020年,H2O AutoML:可扩展的自动机器学习。第七届ICML自动机器学习研讨会(AutoML)(2020年7月)。https://www.automl.org/wp-content/uploads/2020/07/automl_2020_paper_61.pdf谷歌学者谷歌学者
  13. 埃德加·加尔瓦恩·洛佩斯和卡蒂亚·罗德里格斯-巴斯克斯。2007.一棵树中的多个交互输出:实证调查。2007年4月11日至13日,西班牙巴伦西亚,第十届欧洲遗传编程会议,EuroGP 2007,会议记录(计算机科学讲稿,第4445卷)马克·埃布纳(Marc Ebner)、迈克尔·奥尼尔(Michael O'Neill)、阿尼科·埃卡特(AnikóEkárt)、莱昂纳多·范内斯基(Leonardo Vanneschi)和安娜·埃斯帕西亚·阿尔卡扎尔(Anna Esparcia-Alcáza。施普林格,341--350。谷歌学者谷歌学者交叉引用交叉引用
  14. Randal S.Olson、Nathan Bartley、Ryan J.Urbanowicz和Jason H.Moore。2016.自动化数据科学的基于树的管道优化工具评估。谷歌学者谷歌学者交叉引用交叉引用
  15. Randal S.Olson、William La Cava、Patryk Orzechowski、Ryan J.Urbanowicz和Jason H.Moore。2017.PMLB:用于机器学习评估和比较的大型基准套件。生物数据挖掘10、36(2017年12月11日),1-13。谷歌学者谷歌学者交叉引用交叉引用
  16. 迈克尔·奥尼尔。2009年,里卡多·波利(Riccardo Poli)、威廉·B·兰登(William B.Langdon)、尼古拉斯·麦克菲(Nicholas F.McPhee):《遗传编程实地指南:露露》(The Field Guide to Genetic Programming:Lulu)。com,2008年,250页,ISBN 978-1-4092-0073-4。谷歌学者谷歌学者
  17. F.Pedregosa、G.Varoqueaux、A.Gramfort、V.Michel、B.Thirion、O.Grisel、M.Blondel、P.Prettenhofer、R.Weiss、V.Dubourg、J.Vanderplas、A.Passos、D.Cournapeau、M.Brucher、M.Perrot和E.Duchesnay。2011.Scikit-learn:Python中的机器学习。机器学习研究杂志12 (2011), 2825--2830.谷歌学者谷歌学者数字图书馆数字图书馆
  18. 刘德米拉·普罗霍伦科娃(Liudmila Prokhorenkova)、格列布·古塞夫(Gleb Gusev)、阿列克桑德·沃罗贝夫(Aleksandr Vorobev)、安娜·维罗妮卡·多洛古什(Anna Veronika Dorogush)和安德烈·古林。2018.CatBoost:无偏见的助推,具有分类功能。神经信息处理系统研究进展、S.Bengio、H.Wallach、H.Larochelle、K.Grauman、N.Cesa-Bianchi和R.Garnett(编辑),第31卷。Curran Associates公司。https://proceedings.neurips.cc/paper/2018/file/14491b756b3a51daac41c24863285549-paper.pdf谷歌学者谷歌学者
  19. 莱奥·弗朗索索·D·P·索托、保罗·考夫曼、蒂莫西·阿特金森、罗曼·卡尔克鲁斯和马尔西奥·波尔托·巴斯加洛普。2020年,遗传编程图形表示研究。2020年遗传和进化计算会议记录(墨西哥坎昆)(GECCO’20)美国纽约州纽约市计算机协会,931--939。谷歌学者谷歌学者数字图书馆数字图书馆
  20. 尹光耀和理查德·约翰逊。2000.一系列新的权力转换,以改善常态或对称性。生物特征87, 4 (12 2000), 954--959. arXiv公司:https://academic.oup.com/biomet/article-pdf/87/4/954/63321/870954.pdf谷歌学者谷歌学者交叉引用交叉引用

索引术语

  1. MLStar:机器学习程序综合系统

    建议

    评论

    登录选项

    检查您是否可以通过登录凭据或您的机构访问本文。

    登录

    完全访问权限

    • 发布于

      封面图片ACM会议
      GECCO’23伴侣:遗传和进化计算伴侣会议记录
      2023年7月
      2519页
      国际标准图书编号:9798400701207
      DOI(操作界面):2014年10月14日/3583133

      版权所有©2023 ACM

      如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重作者以外的其他人对本作品组成部分的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护].

      出版商

      计算机协会

      美国纽约州纽约市

      出版历史

      • 出版:2023年7月24日

      权限

      请求有关此文章的权限。

      请求权限

      检查更新

      限定符

      • 研究论文

      接受率

      总体验收率1,669属于4,410提交文件,38%

      即将召开的会议

      GECCO’24
      遗传和进化计算会议
      2024年7月14日至18日
      墨尔本,维多利亚州,澳大利亚

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用eReader联机查看。

    电子阅读器