×

火花

swMATH ID: 23653
软件作者: Zaharia M、Chowdhury M、Franklin MJ、Shenker S、Stoica I
描述: Spark:使用工作集的集群计算。MapReduce及其变体在商品集群上实现大规模数据密集型应用程序方面非常成功。然而,大多数这些系统都是围绕一个不适合其他流行应用程序的非循环数据流模型构建的。本文主要关注这样一类应用程序:跨多个并行操作重用数据工作集的应用程序。这包括许多迭代机器学习算法以及交互式数据分析工具。我们提出了一个名为Spark的新框架,它支持这些应用程序,同时保留MapReduce的可伸缩性和容错性。为了实现这些目标,Spark引入了一种称为弹性分布式数据集(RDD)的抽象。RDD是跨一组计算机分区的对象的只读集合,如果分区丢失,可以重建这些对象。Spark在迭代机器学习作业中的性能可以比Hadoop高10倍,并且可以用于交互式查询39GB的数据集,响应时间不到秒。
主页: https://dl.acm.org/citation.cfm?id=1863103.1863113
相关软件: MapReduceHadoop公司德莱德阿帕奇火花MLlib(MLlib)R(右)githubTensorFlow公司普雷格尔Apache闪烁哈斯克尔维斯帕克图形实验室斯卡拉数字Py塔维纳蟒蛇CUDA公司PyTorch公司开放运算语言
引用于: 46文件
全部的 前5名

171位作者引用

阿图尔·祖马
2 佩德罗·蒙塔雷格里
2 伊万·拉帕波特
2 爱荷华州托丹加
1 萨巴·艾哈迈迪
1 艾哈迈德·乔杜里·法尔汉
1 沃尔夫冈·阿伦特
1 阿尔蒂米拉斯,弗朗西斯科
1 医学硕士阿皮舍夫。
1 埃齐奥·巴托西
1 穆罕默德·侯赛因·贝蒂尼
1 佛罗伦萨·贝克尔
1 索黑尔·贝内扎德
1 奥雷连·贝雷特
1 Oya Deniz贝扬
1 多梅尼科·比安库利
1 乔戈斯·博布达基斯
1 萨拉·布亨尼
1 乔根·布兰特
1 詹姆斯·布朗。
1 瓦尔米尔·卡米哈斯。
1 曹泽宏
1 陈云
1 Choi、Woohyuk
1 瓦西里斯·克里斯托菲德斯
1 Ciocan、Dragos Florin
1 迈克尔·科切兹
1 克里斯蒂安·科伦坡
1 泰森·康迪
1 科伊,萨姆
1 危险,尼尔斯
1 达斯,阿里亚姆
1 彼得·戴维斯(Peter A.Davies)。
1 马里奥·塞萨尔·德·坎波斯。
1 de M.Bomfim,Carlos H。
1 德克尔,斯特凡
1 马赫萨·德拉克尚
1 埃德加·多布里班
1 董绍峰
1 大卫·德雷珀
1 伊利耶斯·法尔科内
1 Ferraro Petrillo,翁贝托
1 福塔基斯,Dimitris A。
1 阿德里安·弗兰卡兰扎
1 乌比拉哈拉富美加
1 帕特里克·加里纳里
1 高,袁
1 亚历克斯·吉滕斯(Alex A.Gittens)。
1 圭拉,康塞蒂娜
1 哈加伊、穆罕默德·塔吉
1 菲利普·哈勒
1 何白华
1 谢恩·亨德森。
1 何启荣
1 苏明洪
1 苏珊·R·亨特。
1 马泰奥·因特兰迪
1 马克·艾文(Mark A.Iwen)。
1 郑元基
1 安德烈亚斯·卡纳沃斯
1 迈克尔·凯恩。
1 穆罕默德·雷扎尔·卡里姆
1 帕夫洛斯·卡索格里达基斯
1 哈马马切·卡杜奇
1 萨米尔·库勒
1 Ko、Seyoon
1 鲍里斯·科尔德霍夫
1 Sr Djan Krstić
1 杰库布·奇奇
1 赫尔热·兰塞斯
1 法律,乔纳森
1 Jarod Y.L.Lee。
1 安德烈·莱莫斯。
1 乌尔夫·莱斯
1 刘易斯,Bryan W。
1 李、齐
1 李雪
1 巴布亚州林格拉
1 刘燕燕
1 Lourenço,Joáo M。
1 马尼沙卢特拉
1 Mądry,亚历山大
1 安德斯·马德森。
1 迈克尔·马奥尼。
1 安娜·M·马丁内斯。
1 安德烈斯·马塞戈萨。
1 本杰明·梅内泽斯。
1 米利斯,伊奥尼丝
1 希瑟·米勒
1 瓦哈布·S·米罗尼。
1 斯洛博丹·米特罗维奇
1 穆勒,诺曼
1 波阿斯·纳德勒
1 Thiago A.中村。
1 倪,Eric Cao
1 德扬·尼科维奇
1 托马斯·尼尔森。
1 尼古拉,尼古拉
1 尼古拉斯·诺达拉基斯
1 纳迪亚·努瓦利·塔布德杰马特
…还有71位作者

按年份列出的引文