×

开放多媒体程序库:一个R(右)包连接到机器学习平台OpenML。 (英语) Zbl 1505.62090号

摘要:OpenML是一个在线机器学习平台,研究人员可以在其中轻松共享数据、机器学习任务和实验,并在线组织它们以更高效地工作和协作。在本文中,我们提出了一个R(右)包与OpenML平台接口,并结合机器学习说明其用法R(右)包裹最大似然比[B.Bischl公司等,J.Mach。学习。第17号决议,第170号论文,第5页(2016年;Zbl 1392.68007号)]. 我们展示了开放多媒体程序库包允许R(右)用户可以轻松搜索、下载和上传数据集和机器学习任务。此外,我们还展示了如何上传实验结果、与他人共享以及从其他用户下载结果。除了确保结果的可重复性外,OpenML平台还自动化了大部分繁重的工作,加快了研究速度,促进了协作,并提高了用户的在线可见性。

MSC公司:

62-08 统计学相关问题的计算方法
68T05型 人工智能中的学习和自适应系统
68-04 计算机科学相关问题的软件、源代码等
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] 亚松森A,纽曼DJ(2007)UCI机器学习知识库。加利福尼亚大学信息与计算机科学学院
[2] Bifet A、Holmes G、Kirkby R、Pfahringer B(2010)MOA:大规模在线分析。马赫学习研究杂志11:1601-1604http://www.jmlr.org/papers/v11/bifet10.html
[3] Bischl B,Lang M(2015)parallelMap:并行后端的统一接口。https://CRAN.R-project.org/package=parallelMap,r包版本1.3
[4] Bischl B、Lang M、Kotthoff L、Schiffner J、Richter J、Studerus E、Casalicchio G、Jones ZM(2016)mlr:R.J Mach Learn Res中的机器学习17(170):1-5,http://jmlr.org/papers/v17/15-066.html ·Zbl 1392.68007号
[5] Bischl B、Richter J、Bossek J、Horn D、Thomas J、Lang M(2017)mlrmbo:基于模型优化昂贵黑盒函数的模块化框架。arXiv预打印arXiv:1703.03373
[6] Carpenter J(2011)《最佳分析师获胜》。科学331(6018):698-699·doi:10.1126/science.331.6018.698
[7] Casalicchio G、Bischl B、Kirchhoff D、Lang M、Hofner B、Bossek J、Kerschke P、Vanschoren J(2017)OpenML:更好地探索机器学习。https://CRAN.R-project.org/package=OpenML,R包版本1.3·Zbl 1505.62090号
[8] Feurer M,Springenberg JT,Hutter F(2015)通过元学习初始化贝叶斯超参数优化。收录:AAAI,第1128-1135页
[9] Hall MA、Frank E、Holmes G、Pfahringer B、Reutemann P、Witten IH(2009)《WEKA数据挖掘软件:更新》。SIGKDD探索新闻稿11(1):10-18,网址:http://www.cs.waikato.ac.nz/ml/weka/
[10] Hothorn T,Hornik K,Zeileis A(2006)无偏递归划分:一个条件推理框架。计算网格统计杂志15(3):651-674·doi:10.1198/106186006X133933
[11] Kuhn M、Weston S、Coulter N、Culp M(2015)C50:C5.0决策树和基于规则的模型。https://CRAN.R-project.org/package=C50,R软件包版本0.1.0-24,R.Quinlan为C5.0编写的C代码
[12] Lang M,Kotthaus H,Marwedel P,Weihs C,Rahnenführer J,Bischl B(2015)高维生存分析的自动模型选择。J统计计算模拟85(1):62-76·Zbl 1457.62350号 ·doi:10.1080/00949655.2014.929131
[13] Lang M、Bischl B、Surmann D(2017)《批处理工具:r在批处理系统上的工具》。J开源软件2(10),https://doi.org/10.21105
[14] Liaw A,Wiener M(2002)《随机森林分类和回归》。R新闻2(3):18-22,http://CRAN.R-project.org/doc/Rnews/
[15] 尼尔森M(2012)《重新发现:网络科学的新时代》。普林斯顿大学出版社,网址:http://www.jstor.org/stable/j.ctt7s4vx
[16] Pedregosa F、Varoqueux G、Gramfort A、Michel V、Thirion B、Grisel O、Blondel M、Prettenhofer P、Weiss R、Dubourg V、Vanderplas J、Passos A、Cournapeau D、Brucher M、Perrot M、DuchesnayÉ(2011)Scikit learn:python中的机器学习。J Mach学习研究12:2825-2830,http://scikit-learn.org/ ·Zbl 1280.68189号
[17] Post MJ,van der Putten P,van Rijn JN(2016)特征选择是否改善分类?OpenML的大规模实验。In:智能数据分析国际研讨会,Springer,第158-170页
[18] Probst P、Au Q、Casalicchio G、Stachl C、Bischl B(2017)《R包mlr的多标签分类》。arXiv预打印arXiv:1703.08991
[19] R核心团队(2016)R:统计计算的语言和环境。奥地利维也纳R统计计算基金会,https://www.R-project.org网站/
[20] Schiffner J、Bischl B、Lang M、Richter J、Jones ZM、Probst P、Pfisterer F、Gallo M、Kirchhoff D、Kühn T、Thomas J、Kotthoff L(2016)mlr教程。arXiv预打印arXiv:1609.06146
[21] Therneau T、Atkinson B、Ripley B(2015)rpart:递归分区和回归树。http://CRAN.R-project.org/package=rpart,R包版本4.1-10
[22] van Rijn JN、Umaashankar V、Fischer S、Bischl B、Torgo L、Gao B、Winter P、Wiswedel B、Berthold MR、Vanschoren J(2013)《开放式机器学习的RapidMiner扩展》。摘自:第四届RapidMiner社区会议记录(RCOMM 2013),第59-70页
[23] Vanschoren J、Blockeel H、Pfahringer B、Holmes G(2012)《实验数据库》。分享、组织和从实验中学习的新方法。马赫数学习87(2):127-158·Zbl 1238.68134号 ·doi:10.1007/s10994-011-5277-0
[24] Vanschoren J、van Rijn JN、Bischl B、Torgo L(2013)OpenML:机器学习中的网络科学。SIGKDD勘探15(2):49-60·数字对象标识代码:10.1145/2641190.2641198
[25] Wickham H(2009)ggplot2:数据分析的优雅图形。施普林格,纽约,纽约,美国,http://ggplot2.org ·Zbl 1170.62004号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。