×

用约束编程挖掘时间约束序列模式。 (英语) Zbl 1425.68338号

摘要:约束编程(CP)已被证明是基于约束的序列挖掘的有效平台。之前的工作重点是标准频繁序列挖掘,以及序列中两个匹配事件之间具有最大“间隙”的频繁序列挖掘。后者的主要挑战是,不能独立于普遍存在的频率约束来施加此约束。实际上,间隙约束会改变子序列是否包含在序列中,从而改变其频率。在这项工作中,我们超越了这一点,研究了定时事件的集成,并限制了最小/最大间隙以及最小/最大跨度。后者限制模式的第一个匹配事件和最后一个匹配事件之间的允许时间。我们展示了三者是如何相互关联的,以及对频率约束所需的更改是什么。我们方法的关键是由gap/span定义的扩展窗口的概念,我们开发了一些技术来避免不必要地扫描序列,以及使用支持回溯的数据结构。实验表明,该方法在几乎所有情况下都优于专用方法和基于CP的方法,并且随着最小频率阈值的降低,优势也会增加。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
90 C59 数学规划中的近似方法和启发式
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] Aggarwal,C.C.和Han,J.(2014)。频繁模式挖掘。斯普林格·Zbl 1297.68010号
[2] Agrawal,R.和Srikant,R.(1995)。挖掘序列模式,第十一届数据工程国际会议论文集,1995年。(第3-14页)。
[3] Antunes,C。;奥利维拉,阿拉巴马州;Perner,P.(编辑);Rosenfeld,A.(ed.),带间隙约束的序列模式挖掘的模式增长方法的推广,239-251(2003),柏林·Zbl 1029.68558号 ·doi:10.1007/3-540-45065-3_21
[4] JOR Aoga;枪,T。;Schaus,P。;Frasconi,P.(编辑);Landwehr,N.(编辑);Manco,G.(编辑);Vreeken,J.(ed.),带约束规划的挖掘频繁序列的有效算法,315-330(2016),Cham·数字对象标识代码:10.1007/978-3-319-46227-1_20
[5] Aoga,J.O.R.,Guns,T.,&Schaus,P.(2017年)。利用约束编程挖掘时间约束的序列模式。Salvagnin,D.和Lombardi,M.(Eds.),《人工智能和操作规则技术在约束编程中的集成——第13届国际会议》,2017年CPAIOR,2017年6月5日至8日,意大利帕多瓦,《计算机科学论文集和讲稿》。斯普林格·Zbl 1425.68338号
[6] Ayres,J.、Flannick,J.,Gehrke,J.和Yiu,T.(2002)。使用位图表示的顺序模式挖掘,第八届ACM SIGKDD知识发现和数据挖掘国际会议论文集,2002年7月23日至26日,加拿大艾伯塔州埃德蒙顿(第429-435页)。
[7] Batal,I.、Fradkin,D.、Harrison,J.、Moerchen,F.和Hauskrecht,M.(2012年)。挖掘多变量时间序列数据中事件检测的最近时间模式。第18届ACM SIGKDD知识发现和数据挖掘国际会议论文集(第280-288页)。
[8] Beldiceanu,N.和Contejean,E.(1994年)。在芯片中引入全局约束。数学与计算机建模,20(12),97-123·Zbl 0816.68048号 ·doi:10.1016/0895-7177(94)90127-9
[9] Coquery,E.、Jabbour,S.、SaíS,L.和Salhi,Y.(2012年)。一种基于卫星的方法,用于发现序列中的频繁、闭合和最大模式。在Raedt,L.d.、Bessiöre,C.、Dubois,d.、Doherty,P.、Frasconi,P.,Heintz,F.和Lucas,P.J.F.(编辑),ECAI 2012-第20届欧洲人工智能会议。法国蒙彼利埃,2012年8月27日至31日,《人工智能和应用的前沿》,第242卷,第258-263页。IOS出版社·Zbl 1327.68213号
[10] Desai,N.A.K.和Ganatra,A.(2015)。高效的基于约束的序列模式挖掘(spm)算法,用于从基于时间戳的序列数据集中了解客户的购买行为。Cogent工程,2(1),1072292·doi:10.1080/23311916.2015.1072292
[11] Fournier-Viger,P.,Wu,C.W.,&Tseng,V.S.(2013)。无候选维护的最大序列模式挖掘,高级数据挖掘和应用(第169-180页):Springer·兹伯利0816.68048
[12] Guns,T.、Nijssen,S.和De Raedt,L.(2013)。约束条件下的k-模式集挖掘。IEEE知识与数据工程汇刊,25(2),402-418·doi:10.1109/TKDE.2011.204
[13] Han,J.,Pei,J.、Yin,Y.和Mao,R.(2004)。无候选生成的频繁模式挖掘:一种频繁模式树方法。数据挖掘和知识发现,8(1),53-87·doi:10.1023/B:DAMI.0000005258.31418.83
[14] He,J.、Flener,P.、Pearson,J.和Zhang,W.M.(2013)。解决字符串约束:约束编程案例,约束编程原理和实践国际会议(第381-397页):Springer。
[15] Henriques,R。;Antunes,C。;马德拉,SC;Appice,A.(编辑);Ceci,M.(编辑);Loglisci,C.(编辑);Manco,G.(编辑);Masciari,E.(编辑);Ras,Z.W(编辑),高效发现大项目诱导序列模式的方法,100-116(2014),Cham
[16] Henriques,R.和Madeira,S.C.(2014年)。Bicsap:使用顺序模式的灵活双聚类。BMC生物信息学,15(1),130·数字对象标识代码:10.1186/1471-2105-15-130
[17] Kadioglu,S.和Sellmann,M.(2010年)。语法约束。约束,15(1),117-144·Zbl 1191.68364号 ·doi:10.1007/s10601-009-9073-4
[18] Kemmar,A.、Lebbah,Y.、Loudni,S.、Boizumault,P.和Charnois,T.(2017)。用于序列模式挖掘的前缀投影全局约束和top-k方法。约束,22(2),265-306·Zbl 1475.68346号 ·doi:10.1007/s10601-016-9252-z
[19] Kemmar,A。;Loudni,S。;Lebbah,纽约州。;Boizumault,P。;查诺伊斯,T。;Pesant,G.(编辑),序列模式挖掘的前缀投影全局约束,226-243(2015),Cham
[20] Kemmar,A.、Loudni,S.、Lebbah,Y.、Boizumault,P.和Charnois,T.(2016)。用于挖掘具有GAP约束的序列模式的全局约束。在Quimper,C.(Ed.),《人工智能和OR技术在约束编程中的集成——第13届国际会议》,CPAIOR 2016,加拿大班夫,AB,2016年5月29日至6月1日,计算机科学论文集,讲稿,(第9676卷,第198-215页):Springer·Zbl 1475.68346号
[21] Li,C.和Wang,J.(2008)。有效挖掘具有间隙约束的闭子序列。《SIAM数据挖掘国际会议论文集》,SDM 2008,2008年4月24-26日,美国佐治亚州亚特兰大(第313-322页)。
[22] Lu,S.,&Li,C.(2004)。Aprioriadjust:发现最大序列模式的有效算法。程序中。实习生。车间知识。网格和网格智能。
[23] Mannila,H.、Toivonen,H.和Verkamo,A.I.(1997年)。发现事件序列中的频繁事件。数据挖掘和知识发现,1(3),259-289·doi:10.1023/A:1009748302351
[24] Metivier,J.、Boizumault,P.、Crémilleux,B.、Khiari,M.和Loudni,S.(2011年)。用于声明式模式发现的基于约束的语言。数据挖掘研讨会(ICDMW),2011年IEEE第11届国际会议(第1112-1119页)。
[25] Négrevergne,B.,&Guns,T.(2015)。使用约束编程进行基于约束的序列挖掘。Michel,L.(编辑),《人工智能和操作规则技术在约束编程中的集成——第12届国际会议》,CPAIOR 2015,西班牙巴塞罗那,2015年5月18日至22日,计算机科学论文集,讲稿,(第9075卷,第288-305页):Springer·Zbl 1427.68068号
[26] OscaR团队(2012年)。OscaR:OR中的Scala。可从以下位置获得https://bitbucket.org/oscarlib/oscar。
[27] Parthasarathy,S.、Zaki,M.J.、Ogihara,M.和Dwarkadas,S.(1999)。增量和交互式序列挖掘。第八届信息和知识管理国际会议记录(第251-258页)。
[28] Pei,J.、Han,J.,Mortazavi-Asl,B.、Pinto,H.、Chen,Q.、Dayal,U.和Hsu,M.C.(2001)。前缀跨度:通过前缀预测的模式增长有效地挖掘顺序模式。第17届数据工程国际会议论文集(第215-224页)。
[29] Pei,J.、Han,J.和Wang,W.(2007)。基于约束的序列模式挖掘:模式增长方法。智能信息系统杂志,28(2),133-160·数字对象标识代码:10.1007/s10844-006-0006-z
[30] Pesant,G.(2004)。有限变量序列的正则语言成员约束。在关于约束编程的原理和实践的国际会议上(第482-495页):施普林格·Zbl 1152.68573号
[31] Pinto,H.、Han,J.、Pei,J.,Wang,K.、Chen,Q.和Dayal,U.(2001年)。多维序列模式挖掘。第十届信息和知识管理国际会议记录(第81-88页)。
[32] Quimper,C.G.和Walsh,T.(2006年)。全局语法约束。在约束编程原理和实践国际会议上(第751-755页):Springer·Zbl 1160.68560号
[33] Régin,J.C.(1996)。全局基数约束的广义弧一致性。第十三届全国人工智能会议论文集第1卷(第209-215页):AAAI出版社。
[34] Rossi,F.、Van Beek,P.和Walsh,T.(2006)。CP elsevier手册·Zbl 1175.90011号
[35] Srikant,R.和Agrawal,R.(1996)。挖掘序列模式:泛化和性能改进。斯普林格。
[36] Tatti,N.和Cule,B.(2011年)。挖掘包含同时事件的已结束剧集。第17届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’11(第1172-1180页)。纽约:ACM·Zbl 1260.68346号
[37] Wang,J.、Han,J.和Li,C.(2007)。无候选维护的频繁闭序列挖掘。IEEE知识与数据工程汇刊,19(8),1042-1056·doi:10.1109/TKDE.2007.1043
[38] Yan,X.、Han,J.和Afshar,R.(2003)。Clospan:挖掘:大型数据集中的闭合序列模式。2003年SIAM数据挖掘国际会议论文集(第166-177页):SIAM。
[39] Zaki,M.J.(1998年)。频繁序列的有效枚举。第七届信息和知识管理国际会议记录(第68-75页):ACM。
[40] Zaki,M.J.(2000年)。范畴域中的序列挖掘:合并约束。第九届信息和知识管理国际会议记录(第422-429页):ACM。
[41] Zhao,Q.和Bhowmick,S.S.(2003)。序列模式挖掘:一项调查。技术报告CAIS新加坡南洋理工大学,第1-26页。
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。