×

挖掘顶部-用间隙约束区分序列模式。 (中文。英文摘要) Zbl 1349.68066号

摘要:区分序列模式可以用来表示数据集之间的差异,因此具有广泛的应用,例如商品推荐、用户行为分析和供电预测。以前的挖掘区分序列模式的算法要求用户设置正负支持阈值。如果没有足够的数据集先验知识,用户很难设置适当的支持阈值,从而丢失一些重要的对比模式。为了解决这个问题,提出了一种挖掘满足间隙约束的顶部区分序列模式的算法,称为(k)DSP-miner(top-\(k)distingting sequential patterns with gap constraint miner)。DSP-miner没有直接设置对比度阈值,而是引入了一个用户友好的参数,该参数指示要发现的顶级区分模式的预期数量。它使(k)DSP-miner易于使用,并且其挖掘结果更易于理解。为了提高DSP-miner的效率,设计了几种剪枝策略和启发式策略。此外,还设计了一个多线程版本的DSP-miner,以增强其在处理具有高维元素集的序列时的适用性。在真实数据集上的实验表明,该算法是有效的。

MSC公司:

第68页,共15页 数据库理论
PDF格式BibTeX公司 XML格式引用
全文: 内政部