跳到主要内容
10.5555/876881.879716诉讼指南文章/章节视图摘要出版物页面会议记录acm-pubtype公司
第条

PrefixSpan:通过前缀预测模式增长高效挖掘序列模式

出版:2001年4月2日出版历史

摘要

摘要:序列模式挖掘是一个应用广泛的重要数据挖掘问题。这是一个挑战,因为可能需要检查可能的子序列模式的组合爆炸数。以前开发的大多数序列模式挖掘方法都遵循Apriori的方法,这可能会大大减少要检查的组合数量。然而,当序列数据库较大和/或要挖掘的序列模式众多和/或较长时,Apriori仍然会遇到问题。本文提出了一种新的序列模式挖掘方法,称为PrefixSpan(即Prefix-projected sequential pattern mining),它探索了序列模式挖掘中的前缀投影。PrefixSpan挖掘完整的模式集,但大大减少了候选子序列生成的工作量。此外,前缀投影大大减少了投影数据库的大小,并导致高效处理。我们的性能研究表明,PrefixSpan在挖掘大型序列数据库方面优于基于Apriori的GSP算法和另一种最近提出的方法FreeSpan。前缀跨度

索引术语

  1. PrefixSpan:通过前缀预测模式增长高效挖掘序列模式
      索引项已通过自动分类分配给内容。

      建议

      评论

      登录选项

      检查您是否可以通过登录凭据或您的机构访问本文。

      登录

      完全访问权限

      • 发布于

        封面图片指南会议记录
        ICDE'01:第17届国际数据工程大会论文集
        2001年4月

        版权所有©Copyright(c)2001 Institute of Electrical and Electronics Engineers,Inc.保留所有权利。

        出版商

        IEEE计算机学会

        美国

        出版历史

        • 出版:2001年4月2日

        限定符

        • 第条