×

增量序列模式挖掘的序列树方法。 (英语) Zbl 1365.68367号

摘要:“序列模式挖掘”是从大型数据库中探索知识和创新的一种突出而重要的方法。常见的序列模式挖掘算法处理静态数据库。从实用的角度来看,从功能和实际执行来看,数据库呈指数级增长,从而导致了这种创新、研究和开发的必要性和要求,最终导致了挖掘算法的设计。一旦数据库更新,以前的挖掘结果将不正确,我们需要重新启动并触发新更新的序列数据库的整个挖掘过程。为了克服和避免重新扫描整个数据库的过程,可以使用这种独特的顺序模式增量挖掘系统。前面的方法、系统和技术是基于先验的框架,但地雷模式是一种先进而复杂的技术,可以提供所需的解决方案。我们提出并合并了一个名为STISPM的算法,用于使用序列树空间结构对序列模式进行增量挖掘。STISPM使用深度优先方法、反向跟踪和动态前瞻修剪策略,删除不常见和不规则的模式。从根节点到任何叶节点的过程和方法描述了数据库中的顺序模式。序列树的结构特点使其便于进行增量序列模式挖掘。序列树还存储了所有的序列模式及其计数和统计信息,因此,无论何时撤销或更改支持系统,我们使用频繁序列树作为存储结构的算法都可以找到并检测所有序列模式,而无需再次挖掘数据库。

MSC公司:

68T05型 人工智能中的学习和自适应系统
第68页,共15页 数据库理论
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Agarwal R和Srikant R 1995采矿序列模式。摘自:第11届国际数据工程会议记录第3-14页
[2] Zhao Q和Bhowmick S S 2003序列模式挖掘:一项调查。新加坡南洋理工大学CAIS技术报告。第118号
[3] Han J,Pei J,Mortazavi Asl B,Chen Q,Dayal U和Hsu M C 2000a FreeSpan:频繁模式投影序列模式挖掘。摘自:第六届ACM SIGKDD知识发现和数据挖掘国际会议记录第355-359页
[4] Cheung D W、Lee D W和Kao S D 1997用于维护发现的关联规则的通用增量技术。摘自:第五届高级应用数据库系统国际会议记录,第185-194页
[5] Lin M Y和Lee S Y 1998大型数据库中序列模式的增量更新。摘自:第十届IEEE人工智能工具国际会议,第24-31页
[6] Sarda N L和Srinivas N V 1998关联规则增量挖掘的自适应算法。摘自:第九届数据库和专家系统国际研讨会,第240-245页
[7] Zhang S 1999数据库挖掘的聚合和维护。智力。数据分析。475-490
[8] Srikant R和Agrawal R 1996挖掘序列模式:概括和性能改进。摘自:《第五届扩展数据库技术国际会议论文集》,第3-17页·Zbl 0970.68052号
[9] Garofalakis M N、Rastogi R和Shim K 1999 SPIRIT:序列模式挖掘正则表达式约束。摘自:第25届超大数据库国际会议记录,第223-234页
[10] Parthasarathy S、Zaki M、Ogihara M和Dwarkadas S 1999增量和交互式序列挖掘。载:《第八届信息和知识管理国际会议论文集》,第251-258页
[11] Ayan N F、Tansel A U和Arkun E 1999通过早期修剪更新大型项目集的高效算法。摘自:第五届ACM SIGKDD知识发现和数据挖掘国际会议记录,第287-291页
[12] Omiecinski E和Savasere A 1998大型动态数据库中关联规则的高效挖掘。摘自:第16届英国国家数据库会议记录,第49-63页
[13] Cheng H,Yan X和Han J 2004 IncSpan:大型数据库中序列模式的增量挖掘。摘自:第十届ACM SIGKDD国际会议知识发现和数据挖掘会议记录,第527-532页
[14] Huang J W,Tseng C Y,Ou J C和Chen M S 2008使用渐进式数据库进行序列模式挖掘的通用模型。IEEE传输。知识。数据工程20(9):1153-1167·doi:10.1109/TKDE.2008.37
[15] Hong T P、Wang C Y和Tseng S S 2011使用预大序列维护序列模式的增量挖掘算法。专家系统。申请。38: 7051-7058 ·doi:10.1016/j.eswa.2010.12.008
[16] Pei J、Han J、Mortazavi Asl B、Pinto H、Chen Q、Dayal U和Hsu M C 2001前缀span:通过前缀预测模式增长有效挖掘序列模式。摘自:数据库和数据挖掘知识发现国际会议,第215-224页·Zbl 0970.68052号
[17] Ayres J、Flannick J、Gehrke J和Yiu T 2002使用位图表示的顺序模式挖掘。摘自:第八届ACM SIGKDD知识发现和数据挖掘国际会议记录,第429-435页
[18] Zaki M J 2001 SPADE:挖掘频繁序列的有效算法。In:程序。机器。学习。(非监督学习专题),42:31-60·Zbl 0970.68052号
[19] Han J,Pei J和Yin Y 2000b在没有候选生成的情况下挖掘频繁模式。摘自:2000年ACM SIGMOD国际数据管理会议记录第1-12页
[20] Lin C W、Hong T P和Lu W H 2009增量挖掘的Pre-FUFP算法。J.专家系统。申请。36: 9498-9505 ·doi:10.1016/j.eswa.2008.03.014
[21] Hong T P,Lin J W和Wu Y L 2006快速更新的频繁模式树。摘自:IEEE系统、人和控制论国际会议,第2167-2172页
[22] Cheung D W,Han J,Ng V T和Wong C Y 1996大型数据库中发现的关联规则的维护:增量更新方法。摘自:第12届IEEE数据工程国际会议,第106-114页
[23] Agrawal R和Srikant R 1994挖掘关联规则的快速算法。摘自:《第20届超大数据库国际会议论文集》,第487-499页
[24] Thomas S、Bodagala S、Alsabti K和Ranka S 1997大型数据库中关联规则增量更新的有效算法。摘自:第三届知识发现和数据挖掘国际会议论文集,第263-266页
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。