×

谷歌的MapReduce编程模型——重温。 (英语) Zbl 1129.68414号

概述:谷歌的MapReduce编程模型用于以大规模并行方式处理大型数据集。我们对该模型进行了第一次严格描述,包括它作为谷歌领域特定语言Sawzall的进步。为此,我们对MapReduce和Sawzall上的开创性论文进行了反向工程,并将我们的发现作为可执行规范捕获。我们还发现并解决了开创性论文中非正式陈述中的一些模糊之处。我们使用类型化函数编程(特别是Haskell)作为设计恢复和可执行规范的工具。我们的开发包括三个组件:(i)MapReduce计算的基本程序框架;(ii)执行MapReduce计算时的并行机会;(iii)Sawzall聚合器的基本特征是MapReduce方法的进步。我们的开发没有将MapReduce计算的实际分布式执行的更多实现方面形式化。

MSC公司:

68甲19 其他编程范式(面向对象、顺序、并发、自动等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部