×

Skopus:在杠杆作用下挖掘顶部序列模式。 (英语) 兹比尔1411.68119

摘要:本文提出了一个在杠杆作用下精确发现顶部序列模式的框架。它结合了(1)序列模式预期支持的新定义(大多数兴趣度测量直接依赖于此概念)和(2)Skopus:一种新的分支定界算法,用于在给定的兴趣度测量下精确发现顶部(k)序列模式。我们的兴趣度度量采用了分区方法。模式的有趣之处在于,它的出现频率比通过假设组成它的任何一对模式之间的独立性来解释的频率更高。与独立条件下的预期相比,支持越大,模式就越有趣。我们以这两个元素为基础,准确提取具有最高杠杆率的序列模式,这与我们对预期支持的定义一致。我们对具有已知模式的合成数据和真实数据集进行了实验;这两个实验都证实了我们的方法在最新技术方面的一致性和相关性。

MSC公司:

68T05型 人工智能中的学习和自适应系统
2007年6月62日 数据分析(统计)(MSC2010)
62H30型 分类和区分;聚类分析(统计方面)
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Achar A,Laxman S,Viswanathan R,Sastry P(2012)《发现具有一般偏序的内射集》。数据最小知识发现25(1):67-108·Zbl 1260.68317号 ·doi:10.1007/s10618-011-0233-y
[2] Achar A,Sastry P(2015)具有一般部分顺序的事件的统计意义。信息科学296:175-200·Zbl 1360.68662号 ·doi:10.1016/j.ins.2014.09.063
[3] Aggarwal CC,Han J(eds)(2014)频繁模式挖掘。海德堡施普林格·Zbl 1297.68010号
[4] Agrawal R,Imielinski T,Swami A(1993)挖掘大型数据库中项目集之间的关联规则。1993年ACM-SIGMOD国际数据管理会议记录,第207-216页。华盛顿特区
[5] Agrawal R,Srikant R(1995)挖掘序列模式。摘自:《第十一届国际数据工程会议论文集》,1995年3月6日至10日,台湾台北,第3-14页。IEEE计算机协会
[6] Bayardo Jr,RJ,Agrawal R(1999)挖掘最有趣的规则。摘自:第五届ACM SIGKDD知识发现和数据挖掘国际会议记录,第145-154页。ACM,纽约
[7] Boley M,Horváth T,Wrobel S(2009)基于强封闭性的有趣模式的高效发现。统计分析数据最小值2(5-6):346-360·doi:10.1002/上午.10057
[8] Castro NC,Azevedo PJ(2012)时间序列中的重要主题。统计分析数据最小值5(1):35-53·Zbl 07260311号 ·doi:10.1002/sam.11134
[9] Fournier-Viger P、Gomariz A、Guechec T、Mwamikazi E、Thomas R(2013)《TKS:top-k序列模式的高效挖掘》。摘自:《高级数据挖掘和应用》,第九届国际会议,2013年12月14日至16日,ADMA 2013,杭州,会议记录,第一部分,计算机科学讲稿,第8346卷,第109-120页。柏林施普林格
[10] Geng L,Hamilton HJ(2007)选择正确的镜头:发现数据挖掘中有趣的内容。摘自:数据挖掘中的质量度量,第3-24页。柏林施普林格
[11] Gwadera R、Atallah MJ、Szpankowski W(2005)用于识别重大事件的马尔可夫模型。摘自:SIAM数据挖掘国际会议,第404-414页
[12] Gwadera R、Atallah MJ、Szpankowski W(2005)《事件序列中事件的可靠检测》。知识信息系统7(4):415-437·doi:10.1007/s10115-004-0174-5
[13] Gwadera R,Crestani F(2010)《序列模式重要性排名》。摘自:《知识发现和数据挖掘的进展》,第14届亚太会议,2010年6月21日至24日,海得拉巴,PAKDD 2010。诉讼程序。第一部分,计算机科学课堂讲稿,第6118卷,第286-299页。柏林施普林格
[14] Hämäläinen W(2010)利用Fisher的精确显著性检验高效发现top-k最优依赖规则。摘自:ICDM 2010,第十届IEEE数据挖掘国际会议,澳大利亚悉尼,2010年12月14-17日,第196-205页。IEEE计算机协会
[15] 韩杰,程浩,辛丁,严X(2007)频繁模式挖掘:现状与未来方向。数据最小知识发现15(1):55-86·doi:10.1007/s10618-006-0059-1
[16] 韩J,裴J,莫塔扎维-Asl B,陈Q,大亚尔U,许M(2000)Freespan:free-projected sequential pattern mining。摘自:第六届ACM SIGKDD知识发现和数据挖掘国际会议论文集,马萨诸塞州波士顿,2000年8月20日至23日,第355-359页。ACM,纽约
[17] Jaroszewicz S,Simovici DA(2004)使用贝叶斯网络作为背景知识的频繁项集的有趣性。摘自:《第十届ACM SIGKDD知识发现和数据挖掘国际会议论文集》,第178-196页。ACM,纽约
[18] Lam HT、Moerchen F、Fradkin D、Calders T(2014)《挖掘压缩序列模式》。统计分析数据最小值7(1):34-52·Zbl 07260381号 ·doi:10.1002/sam.11192
[19] Low-Kam C、Raíssi C、Kaytoue M、Pei J(2013)《挖掘具有统计意义的序列模式》。摘自:2013年IEEE第13届数据挖掘国际会议,德克萨斯州达拉斯,2013年12月7日至10日,第488-497页。IEEE计算机协会
[20] Mabroukeh NR,Ezeife CI(2010)序列模式挖掘算法分类。ACM计算概况43(1):3·数字对象标识代码:10.1145/1824795.1824798
[21] Mampaey M、Vreeken J、Tatti N(2012)用信息量最大的项目集简明扼要地总结数据。ACM变速器知识发现数据6(4):16·doi:10.1145/2382577.2382580
[22] Mannila H,Toivonen H,Verkamo AI(1995)发现序列中的频繁插曲。载:《第一届知识发现和数据挖掘国际会议论文集》(KDD-95),加拿大蒙特利尔,1995年8月20日至21日,第210-215页。AAAI出版社
[23] Mannila H,Toivonen H,Verkamo AI(1997)发现事件序列中的频繁事件。数据最小已知Discov 1(3):259-289·doi:10.1023/A:1009748302351
[24] Masseglia F,Cathala F,Poncelet P(1998)挖掘序列模式的PSP方法。摘自:《数据挖掘和知识发现原理》,第二届欧洲研讨会,1998年9月23日至26日,PKDD’98,法国南特,计算机科学论文集,第1510卷,第176-184页。柏林施普林格
[25] Mooney CH,Roddick JF(2013)《顺序模式挖掘方法和算法》。ACM计算概况45(2):19·Zbl 1293.68246号 ·doi:10.1145/2431211.2431218
[26] Pei J,Han J,Mortazavi-Asl B,Pinto H,Chen Q,Dayal U,Hsu M(2001)前缀跨度:通过前缀预测增长挖掘序列模式。摘自:《第17届数据工程国际会议论文集》,2001年4月2-6日,德国海德堡,第215-224页。IEEE计算机协会
[27] Piatetsky-Shapiro,G。;Piatetsky-Shapiro,G.(编辑);Frawley,J.(编辑),《强规则的发现、分析和呈现》,229-248(1991),门罗公园
[28] Raíssi C,Calders T,Poncelet P(2008)挖掘连接序列模式。数据最小知识发现17(1):77-93·doi:10.1007/s10618-008-0108-z
[29] Siebes A、Vreeken J、van Leeuwen M(2006)压缩项目集。摘自:《第六届SIAM数据挖掘国际会议论文集》,2006年4月20日至22日,贝塞斯达,第395-406页。SIAM公司·Zbl 1235.68071号
[30] Tatti N(2009)基于最小窗口的情节重要性。摘自:IEEE数据挖掘国际会议,第513-522页
[31] Tatti N(2014)发现具有紧凑最小窗口的剧集。数据最小知识发现28(4):1046-1077·Zbl 1298.68247号 ·doi:10.1007/s10618-013-0327-9
[32] Tatti N(2015)使用划分模型对剧集进行排名。数据最小知识发现29(5):1312-1342·Zbl 1405.68308号 ·doi:10.1007/s10618-015-0419-9
[33] Tatti N,Mampaey M(2010)使用背景知识对项目集进行排序。数据最小知识发现21(2):293-309·doi:10.1007/s10618-010-0188-4
[34] Tatti N,Vreeken J(2012)《它的长与短:用连续剧总结事件序列》。摘自:第十届ACM SIGKDD知识发现和数据挖掘国际会议记录,第462-470页
[35] Tew CV、Giraud-Carrier CG、Tanner KW、Burton SH(2014),关联规则挖掘中基于行为的聚类和兴趣度分析。数据最小知识发现28(4):1004-1045·兹比尔1298.68230 ·doi:10.1007/s10618-013-0326-x
[36] 牛津英语语料库(2015)牛津英语语料库:关于语言的事实。收录:牛津词典。牛津大学出版社,牛津。http://www.oxforddiconaries.com/words/the-oec-facts-about-the-language
[37] 塔克A(2006)《应用梳理》。纽约威利
[38] Tzvetkov P,Yan X,Han J(2003)TSP:挖掘top-k闭序列模式。收录于:第三届IEEE数据挖掘国际会议(ICDM 2003),2003年12月19-22日,墨尔本,第347-354页。IEEE计算机协会
[39] Vreeken J,van Leeuwen M,Siebes A(2011)Krimp:压缩的挖掘项集。数据最小知识发现23(1):169-214·Zbl 1235.68071号 ·doi:10.1007/s10618-010-0202-x
[40] Webb G(2010)自足项目集:一种筛选项目之间潜在有趣关联的方法。Trans Knowl发现数据4:3:1-3:20
[41] Webb GI(1995)OPUS:一种有效的无序搜索容许算法。《艺术情报研究杂志》3:431-465·Zbl 0900.68180号
[42] Webb GI(2000)高效搜索关联规则。摘自:第六届ACM SIGKDD知识发现和数据挖掘国际会议记录,第99-107页。ACM,纽约
[43] Webb GI(2007)发现重要模式。马赫数学习68(1):1-33·Zbl 1470.68195号 ·数字对象标识代码:10.1007/s10994-007-5006-x
[44] Webb GI(2008)分层临界值:发现重要模式的强大直接调整方法。马赫数学习71(2-3):307-323·Zbl 1470.68196号 ·数字对象标识代码:10.1007/s10994-008-5046-x
[45] Webb GI(2010)自足项目集:一种筛选项目之间潜在有趣关联的方法。ACM事务处理知识发现数据4(1):3·数字对象标识代码:10.1145/1644873.1644876
[46] Webb GI(2011)Filtered-top-k关联发现。威利Interdisc Rev Data Min Knowl Discov 1(3):183-192·doi:10.1002/widm.28
[47] Webb GI,Vreeken J(2014)高效发现最有趣的关联。ACM事务处理知识发现数据8(3):1-31·数字对象标识代码:10.1145/2601433
[48] Yan X,Han J,Afshar R(2003)Clospan:在大型数据库中挖掘闭合序列模式。摘自:《第三届SIAM数据挖掘国际会议论文集》,旧金山,2003年5月1-3日,第166-177页。暹罗
[49] Zimmermann,A。;Li,J.(编辑);Cao,L.(编辑);Wang,C.(编辑);Tan,K.(编辑);Liu,B.(编辑);Pei,J.(编辑);Tseng,V.(编辑),《客观评估频繁项集挖掘的兴趣度测度》,第7867、354-366号(2013),柏林-海德堡·doi:10.1007/978-3642-40319-431
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。