哈洛普

HaLoop:大型集群上高效的迭代数据处理。简单地说,HaLoop=Ha,Loop:-)HaLoop是Hadoop MapReduce框架的一个修改版本,旨在为这些应用程序服务。HaLoop不仅扩展了MapReduce对迭代应用程序的编程支持,还通过使任务调度器循环感知和添加各种缓存机制显著提高了它们的效率。我们在真实查询和真实数据集上对HaLoop进行了评估,结果发现,与Hadoop相比,HaLoop平均减少了1.85个查询运行时间,并且在映射器和reducer之间仅混洗了4%的数据。简而言之,HaLoop具有以下特性:1)为循环不变数据访问提供缓存选项,2)允许用户重用应用程序Hadoop实现中的主要构建块,以及3)具有与Hadoop类似的作业内容错机制。此外,HaLoop还向后兼容Hadoop作业。注意,在这个阶段,HaLoop只是一个原型系统,而不是一个生产系统。我们正在尽最大努力使这个系统更加健壮和稳定。

此软件的关键字

这里的任何内容都将在支持canvas元素的浏览器上被替换


数学参考文献

显示结果1到3,共3个。
按年份排序(引用)

  1. Pelucchi,Mauro;Psaila,Giuseppe;Toccu,Maurizio:Hadoop vs.Spark:对开放数据语料库Hammer查询引擎性能的影响(2018)
  2. Berlinïska,Joanna;Drozdowski,Maciej:调度多层可分计算(2015)
  3. 张俊波;黄建元;李天瑞;潘毅:不同MapReduce运行时系统下基于粗糙集理论的并行大规模知识获取比较(2014)ioport公司