计算机科学››2024,第51卷››问题(5): 70-84.数字对象标识:10.11896/jsjkx.230300003
•数据库、大数据和数据科学• 以前的文章 下一篇文章
何媛、王欣、沈玲珍
收到:
修订过的:
在线:
出版:
关于作者:
支持单位:
摘要:频繁模式挖掘是图挖掘中最重要的问题之一。FPM问题定义为挖掘所有模式,在一个大图形中频率高于用户定义的阈值。近年来,随着社交网络等的普及,基于单字符的FPM受到了越来越多的关注。研究人员已经开发了相当多的技术,但大多数技术都存在计算成本高、结果检查不方便和并行计算不方便等问题。为了解决这些问题,本文提出了一种发现多元化顶层的方法-k个单个大图形的模式。本文首先设计了一个多样化函数来测量模式的多样性,然后开发了一个具有早期终止特性的分布式算法DisTopk,以有效地识别多样化的顶部-k个模式,来自分布式存储图。对真实图形和合成图形进行的实验结果表明,DisTopk可以挖掘多种顶部-k个模式比传统算法更有效。
关键词: 频繁模式挖掘, 顶部-k个模式, 结果多样化, 分布式开采, 提前终止
CLC编号:
何媛、王欣、沈玲珍。多样化上衣-k个大图上的模式挖掘[J]。计算机科学,2024,51(5):70-84。
0 / / 推荐
添加到引文管理器 尾注|样板客户经理|ProCite公司|BibTeX公司|参考Works
网址: https://www.jsjkx.com/EN/10.11896/jsjkx-230300003
https://www.jsjkx.com/EN/Y2024/V51/I5/70
引用