×

机器学习R程序的运行时和内存消耗分析。 (英语) Zbl 1457.62020年

摘要:R是一种具有动态类型系统、不同对象系统和功能特征的多仿射语言。这些特征支持在高抽象级别上开发统计算法。虽然R通常用于统计领域,但它的一大缺点是在处理计算密集型算法时存在运行时问题。特别是在机器学习领域,纯R程序的执行速度往往慢得令人无法接受。我们的长期目标是解决这些问题,在这篇文章中,我们使用traceR工具分析了该领域中出现的瓶颈。在这里,我们测量了一组定义良好的经典机器学习应用程序的运行时和总内存消耗,并获得了这些程序性能问题的详细见解。

MSC公司:

62-08 统计问题的计算方法
62H30型 分类和区分;聚类分析(统计方面)
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Tierney L.编译R:初步报告。附:第二届分布式统计计算国际研讨会论文集;2001.[谷歌学者]
[2] Tierney L.LISP-STAT:统计计算和动态图形的面向对象环境,纽约:Wiley-Interscience;1990.【Crossref】,【谷歌学者】·Zbl 0747.62007号
[3] Boehland J.RIncenter——使用Clojure和Incanter的嵌入式R;2014年。可从以下网址获得:https://github.com/jolby/rincanter。[谷歌学者]
[4] Bertram A.Renjin:基于JVM的统计计算R语言解释器;2014年。可从以下网址获得:http://www.renjin.org。[谷歌学者]
[5] Talbot J,DeVito Z,Hanrahan P.Riposte:R中矢量代码的跟踪驱动编译器和并行VM。in:第21届并行体系结构和编译技术国际会议论文集。美国明尼苏达州明尼阿波利斯市12号协议,纽约州纽约市:ACM;2012年,第43-52页。[谷歌学者]
[6] Kane MJ、Emerson JW。鹦鹉VM不太适合。耶鲁大学;2014年。可从以下网址获得:https://github.com/NQRCore。[谷歌学者]
[7] Neal R.pqR——多伦多大学统计系和计算机科学系的一个相当快速的版本;2014年上市时间:https://github.com/radfordneal/pqR。[谷歌学者]
[8] Wang H,Wu P,Padua D.优化R VM:通过解释器级专业化去除分配和减少路径长度。In:代码生成和优化(CGO)国际研讨会论文集,CGO’14,佛罗里达州奥兰多;2014.[谷歌学者]
[9] Morandat F、Hill B、Osvald L、Vitek J。反应堆项目。普渡大学;2014年。可从以下网址获得:http://r.cs.purdue.edu。[谷歌学者]
[10] Almasi G、Padua DA、MaJIC。一个matlab实时编译器。收录人:Midkiff SP、Moreira JE、Gupta M、Chatterjee S、Ferrante J、Prins J、Pugh W、Tseng C-W编辑。第13届并行计算语言和编译器国际研讨会会议记录-修订论文。施普林格·弗拉格:英国伦敦,2001年,第68-81页。[谷歌学者]·Zbl 1014.68740号
[11] Bolz CF,Cuni A,Fijalkowski M,Rigo A.跟踪元级:PyPy的跟踪JIT编译器。摘自:关于面向对象语言和编程系统的实现、编译和优化的第四次研讨会论文集。ICOOLPS’09,意大利热那亚:ACM;2009年,第18-25页。[谷歌学者]
[12] Kotthaus H,Plazar S,Marwedel P.R语言的基于JVM的编译器策略。收录:第八届国际R用户大会(user!)摘要小册子。美国田纳西州纳什维尔;2012年,第68页。[谷歌学者]
[13] Kalibera T,Maj P,Morandat F,Vitek J.R的快速抽象语法树解释器In:第十届ACM SIGPLAN/SIGOPS虚拟执行环境国际会议论文集,美国犹他州盐湖城:ACM;2014年,第89-102页。[谷歌学者]
[14] Morandat F,Hill B,Osvald L,Vitek J.评估R语言的设计:数据分析的对象和函数。摘自:第26届欧洲面向对象编程会议记录。北京:Springer-Verlag;2012年,第104-131页。[谷歌学者]
[15] Bache K,Lichman M.UCI机器学习库。加州大学欧文分校信息与计算机科学学院;2014年。可从以下网址获得:http://archive.ics.uci.edu/ml。[谷歌学者]
[16] Korb I、Kotthaus H、Künne M.TraceR:多特蒙德理工大学的分析工具;2014年。可从以下网址获得:https://github.com/allr/tracer[谷歌学者]
[17] Culp M、Johnson K、Michailidis G.ada:随机增压的R包。R包版本2.0-3;2012年。可从以下地点购买:http://CRAN.R-project.org/package=ada。[谷歌学者]
[18] Hothorn T,Hornik K,Zeileis A.无偏递归划分:条件推理框架。计算图统计杂志。2006;15:651-674. R软件包版本“1.0-13”。doi:10.1198/106186006X133933[Taylor&Francis Online],[Web of Science®],[Google学者]
[19] 借助他人的贡献,Ridway G。gbm:广义boost回归模型。R包2.1版;2013年。可从以下网址获得:http://CRAN.R-project.org/package=gbm。[谷歌学者]
[20] Hechenbichler KSK公司。kknn:加权k近邻。R包版本1.2-5;2013年。可从以下网址获得:http://CRAN.R-project.org/package=kknn。[谷歌学者]
[21] Karatzoglou A、Smola A、Hornik K、Zeileis A.kernlab–R.J Statist Softw中内核方法的S4包。2004;11:1-20. R包版本0.9-19。[谷歌学者]
[22] Venables WN,Ripley BD。现代应用统计学与S.Fourth。纽约:Springer;2002.R包版本7.3-29。[Crossref],[Google学者]·Zbl 1006.62003号
[23] Meyer D、Dimitriadou E、Hornik K、Weingessel A、Leisch F.e1071:统计部的其他职能(e1071),TU Wien。R包版本1.6-2;2012年。可从以下网址获得:http://CRAN.R-project.org/package=e1071。[谷歌学者]
[24] Liaw A,Wiener M.通过randomForest进行分类和回归。R新闻。2002;2:18-22. R软件包版本4.6-7。[谷歌学者]
[25] Weihs C、Ligges U、Luebke K、Raabe N.klaR:分析德国商业周期。收录人:Baier D、Decker R、Schmidt-Thieme L,编辑。数据分析和决策支持。R包版本0.6-9。柏林-海德堡:施普林格-弗拉格;2005年,第335-343页。[Crossref],[谷歌学者]
[26] Therneau T、Atkinson B、Ripley B.rpart:递归分区。R包版本4.1-3;2013年。可从以下网址获得:http://CRAN.R-project.org/package=rpart。[谷歌学者]
[27] Bischl B.mlr:R.R包版本1.0-2612中的机器学习;2013年。可从以下网址获得:http://CRAN.R-project.org/package=mlr。[谷歌学者]
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。