发现具有一般偏序的内射集
指出在偏序挖掘的背景下,频率本身并不是兴趣度的充分度量,并且针对具有不受限制偏序的情节提出了一种新的兴趣度度量,当与频率一起使用时,该度量会产生一种有效的数据挖掘方案。 发现频繁的连锁事件
本文讨论了BE测度如何推广到链式情节,证明了它在一般情况下所满足的单调性,并描述了链式情节的频率计数和BE计算步骤。 典型医疗序列变异的检测与可视化
提出了一种在考虑时间信息的情况下检测医嘱频繁序列模式中变异的方法,并开发了一个交互式图形界面系统,用于可视化临床路径中变异的结果。 事件流中频繁情节的快速查找算法
本文在这种基于非重叠事件的频率定义下,提出了一些新的频繁事件发现算法,并通过一些仿真实验表明,这些算法是非常有效的。 在序列数据中发现无界情节
提供了一个更直观的有趣剧集定义,从而允许有趣剧集在挖掘过程中不断增长,而无需任何特定于用户的帮助。 序列数据的全局部分订单
该方法基于将偏序视为序列集的生成模型,并应用混合建模技术获得描述序列集合中事件之间排序关系的描述性偏序集。 从字符串中发现频繁闭偏序
为了解决这个问题,开发了Frecpo,设计了一种实用高效的算法,用于从大型字符串数据库中挖掘完整的频繁闭偏序集,并设计了几种有趣的修剪技术来加快搜索速度。 事件序列中频繁情节的发现
这项工作为从给定的事件类别中发现所有频繁事件提供了有效的算法,并给出了在电信报警管理中使用的详细实验结果。 挖掘序列模式:泛化和性能改进
这项工作添加了时间约束,指定了模式中相邻元素之间的最短和/或最长时间段,并放宽了顺序模式中元素中的项目必须来自同一事务的限制。 离群值对误分类率影响的实证研究
本文使用基于中心稳健统计估计和马氏距离协方差矩阵的离群点检测、基于聚类的基于围绕medoids(PAM)算法的离群值检测以及两种数据挖掘技术来检测离群点。