基于的计算封闭项集的分布式算法迭代MapReduce框架

徐彪(2011)基于的计算闭项集的分布式算法迭代MapReduce框架。沃特福德理工学院硕士论文。

[论文缩略图_BiaoXu_TSSG.pdf]
预览
PDF格式
主题_BiaoXu_TSSG.pdf

下载(1MB)|预览

摘要

闭项集挖掘是数据挖掘和形式化中的一项主要任务概念分析。这是确定以下模式的有效方法隐藏在原始数据中。这些模式可以表示为关联规则它捕获数据库中变量之间的关系。在正式情况下概念分析,闭项集是形式概念的基础。A类概念由范围和意图组成。事实证明,目的是确切地说是一个封闭项集,它的支持是范围的基数。使用数据挖掘和形式概念分析在知识发现、闭项集挖掘正迅速成为一个吸引人的领域研究领域。虽然已经开发了许多重要的算法来挖掘闭合的形式概念分析和频繁闭项集挖掘中的项集区域,它们通常不适合分布式实现。这个根本原因是闭项集挖掘的理论基础是基于集中的数据表示。通过检查闭项集,我们提出了分布式闭项集计算理论分布式系统中形式概念分析与频繁闭项集挖掘环境。此外,将MapReduce框架作为我们的灵感我们提出了一种通用的分布式方法来执行封闭项集挖掘。然后,我们提供了经典形式概念分析中的集中式算法和频繁闭式算法可以使用我们的方法以分布式方式实现项集挖掘并提出了一系列MR*算法,其中缩写表示MapReduce,*表示具有已被改编。分析影响分布式算法的因素性能,我们将MR*算法与最先进的算法进行了比较。实验在实际数据集上进行的测试表明,MR*算法for Formal Concept Analysis高效且可扩展。MR*算法本工作的频繁闭项集挖掘理论为未来发展。我们分析了实验结果并讨论了我们将在未来工作中关注的瓶颈。

项目类型: 论文(大师赛)
非受控关键字: 分布式算法
部门或组: *这些都没有*
部门: 科学学院>计算、数学和物理系
存款用户: 德里克·朗福德
存款日期: 2012年11月7日11:13
上次修改时间: 2016年8月22日10:26
URI(URI): https://repository.wit.ie/id/eprint/1788

操作(需要登录)

查看项目 查看项目