穆罕默德·扎基。 SPADE:挖掘频繁序列的有效算法。 (英语) Zbl 0970.68052号 机器。学习。 42,编号1-2,31-60(2001). 摘要:我们提出了一种快速发现序列模式的新算法SPADE。该问题的现有解决方案进行重复的数据库扫描,并使用具有较差局部性的复杂散列结构。SPADE利用组合属性将原始问题分解为更小的子问题,这些子问题可以在内存中使用高效的格搜索技术和简单的连接操作独立解决。所有序列仅在三次数据库扫描中发现。实验表明,SPADE比以前最好的算法的性能提高了两倍,并且对一些预处理的数据也提高了一个数量级。它还具有与输入序列数量和许多其他数据库参数相关的线性可伸缩性。最后,我们讨论了序列挖掘的结果如何应用于实际应用领域。 引用于1审查引用于43文件 MSC公司: 第68页,共15页 数据库理论 关键词:铲刀;顺序模式 软件:铲刀;PlanMine公司 PDF格式BibTeX公司 XML格式引用 \textit{M.J.Zaki},马赫。学习。42,编号1--2,31-60(2001;Zbl 0970.68052) 全文: 内政部