DBSCAN先生 swMATH ID: 30348 软件作者: 何,Y.,Tan,H.,Luo,W.,Mao,H.和Ma,D.,Feng,S.,Fan,J。 描述: MR-DBSCAN:一种使用MapReduce的高效并行基于密度的聚类算法。数据聚类是一种重要的数据挖掘技术,在许多科学应用中发挥着至关重要的作用。然而,由于数据集的规模在现实世界中一直快速增长到超大规模,这是一个挑战。同时,MapReduce是一个理想的并行编程平台,广泛应用于各种数据处理领域。本文提出了一种高效的基于密度的并行聚类算法,并通过四阶段MapReduce范式实现。此外,我们对大规模无索引数据采用了快速分区策略。我们研究了相邻分区之间的合并度量并对其进行了优化。最后,我们使用Hadoop平台对实际大规模数据集进行了评估。结果表明,我们的工作速度和规模都非常有效 主页: https://ieeexplore.ieee.org/document/6121313 相关软件: HPDBSCAN公司;SAS公司;COOLCAT公司;AS 102标准;快速排序;4.5条;索姆;UCI-毫升;火花_DBSCAN;开放源码软件;Nak公司;PDSDBSCAN;eof公司;阿帕奇火花;HDF5型;卢斯特;Hadoop公司;磁粉探伤;DBSCAN公司;ADvaNCE公司 引用于: 3文件 全部的 前5名8位作者引用 1 艾拉·阿森特 1 Martin Storgaard迪厄 1 甘国军 1 乔恩·雅各布森 1 马朝群 1 儿子T·梅。 1 赫尔穆特·沃尔夫拉姆·纽基兴 1 吴建红 2篇连载文章中引用 1 数据挖掘与知识发现 1 工业数学(费城) 在3个字段中引用 三 统计学(62-XX) 三 计算机科学(68至XX) 1 生物学和其他自然科学(92-XX) 按年份列出的引文