×

机会主义开采高效用模式。 (英语) Zbl 1440.68225号

摘要:挖掘高效用模式是一个重要的数据挖掘问题,它被定义为寻找效用不小于阈值的模式。由于挖掘结果对这样的阈值非常敏感,用户很难指定合适的阈值。该问题的另一种表述是找到最高效用模式。然而,第二种公式更具挑战性,因为相应的阈值是事先未知的,并且解搜索空间变得更大。当存在很长的模式时,即使对于很小的模式,先前的算法也无法挖掘出最有用的模式。本文提出了一种新的挖掘长的高效用模式的算法。该算法采用了一种机会主义模式增长方法,并提出了五种机会性策略,用于可伸缩地维护短名单模式,高效计算实用程序,以及估计紧上限以修剪搜索空间。大量实验表明,所提出的算法比最先进的顶级高效用模式挖掘算法效率高1到3个数量级,甚至比使用最佳阈值调整的高效用模式挖掘算法快2个数量级。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别

软件:

前缀跨度
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Afrati,F.N。;Gionis,A。;Mannila,H.,《逼近频繁集集》,第十届ACM SIGKDD国际会议知识发现和数据挖掘会议论文集,西雅图,12-19(2004),美国华盛顿
[2] 阿加瓦尔,R。;阿加瓦尔,C。;Prasad,V.,《深度第一代长模式》,第六届ACM SIGKDD国际会议知识发现和数据挖掘会议论文集,108-118(2000),美国马萨诸塞州波士顿
[3] 阿加瓦尔,R。;阿加瓦尔,C。;Prasad,V.,生成频繁项目集的树投影算法,J.并行分布计算。,61, 3, 350-371 (2001) ·Zbl 0990.68058号
[4] 阿格拉瓦尔,R。;Srikant,R.,挖掘关联规则的快速算法,第二十届国际会议论文集,超大数据库,487-499(1994),智利圣地亚哥
[5] Ahmed,A.U。;艾哈迈德,C.F。;萨米乌拉,M。;阿德南,N。;Leung,C.K.-S.,《从不确定数据库中挖掘有趣的模式》,《信息科学》。(纽约),354,60-85(2016)·Zbl 1398.68427号
[6] 艾哈迈德,C.F。;Tanbeer,S.K。;Jeong,B.S。;Lee,Y.K.,增量数据库中高效模式挖掘的高效树结构,IEEE Trans。知识。数据工程,21,12,1708-1721(2009)
[7] Bayardo,R.,《从数据库中高效挖掘长模式》,《ACM SIGMOD国际数据管理会议论文集》,西雅图,85-93(1998),美国华盛顿
[8] Burdick,D。;Calimlim,M。;Gehrke,J.,MAFIA:事务数据库的最大频繁项集算法,第十七届IEEE国际会议数据工程学报,443-452(2001),德国海德堡
[9] 蔡,C.H。;Fu,A.W.C。;程,C.H。;Kwong,W.W.,带加权项的挖掘关联规则,IEEE国际数据库工程与应用研讨会论文集,68-77(1998)
[10] Chan,R。;杨琼。;Shen,Y.,《挖掘高效用项目集》,第三届IEEE国际会议数据挖掘会议记录,19-26(2003),美国佛罗里达州墨尔本
[11] 陈,H。;舒,L。;夏,J。;Deng,Q.,在在线事务数据流的可变大小滑动窗口中挖掘频繁模式,Inf.Sci。(纽约),215,15-36(2012)
[12] 聪,G。;Tan,K.L。;Tung,A.K.H。;Xu,X.,挖掘基因表达数据的顶级覆盖规则组,《ACM SIGMOD国际数据管理会议论文集》,670-681(2005),美国马里兰州巴尔的摩
[13] 埃尔文,A。;戈帕兰,R.P。;Achuthan,N.R.,从大型数据集高效挖掘高效用项目集,第十二届亚太会议知识发现和数据挖掘会议论文集,554-561(2008),日本大阪
[14] Fournier-Viger,P。;Tseng,V.S.,Mining top-(k)sequential rules,第七届国际会议论文集高级数据挖掘与应用,II:180-194(2011),中国北京
[15] Fournier-Viger,P。;Tseng,V.S.,《挖掘顶级非冗余关联规则》,智能系统方法国际研讨会论文集,31-40(2012),中国澳门
[16] Fu,A.W.-C。;Kwong,R.W.-W。;Tang,J.,采矿——最有趣的项目集,《第十二届智能系统方法国际研讨会论文集》,59-67(2000),美国北卡罗来纳州夏洛特·Zbl 0983.68669号
[17] Han,J。;裴,J。;Yin,Y.,《无候选生成的频繁模式挖掘》,《ACM SIGMOD国际数据管理会议论文集》,1-12(2000),美国德克萨斯州达拉斯
[18] Hilderman,R.J。;Carter,C.L。;哈密尔顿·H·J。;Cercone,N.,《使用份额度量和特征化项目集挖掘市场篮子数据》,《第二届亚太知识发现和数据挖掘会议论文集》,159-170(1998),澳大利亚墨尔本
[19] Li,Y.C。;Yeh,J.S。;Chang,C.C.,发现高效用项集的孤立项丢弃策略,数据知识。工程师,64,1198-217(2008)
[20] Lin,M.-Y。;图,T.-F。;Hsueh,S.-C.,使用最大项集属性和字典树结构的高效用模式挖掘,Inf.Sci。(纽约),2151-14(2012)
[21] Lin,T.Y。;Yao,Y.Y。;Louie,E.,增值关联规则,第六届太平洋亚洲会议论文集知识发现与数据挖掘,328-333(2002),台湾台北·Zbl 1048.68821号
[22] 刘,H。;王,X。;He,J。;Han,J。;Xin,D。;Shao,Z.,从高维数据中自顶向下挖掘频繁闭合模式,Inf.Sci。(纽约),179899-924(2009)·Zbl 1162.68561号
[23] 刘杰。;潘,Y。;王凯。;Han,J.,《通过机会主义投影挖掘频繁项目集》,《ACM SIGKDD国际会议知识发现和数据挖掘论文集》,229-238(2002),加拿大艾伯塔省埃德蒙顿
[24] 刘杰。;王凯。;Fung,B.C.M.,无需候选生成即可直接发现高效用项集,第十二届IEEE国际会议论文集,数据挖掘,984-989(2012),比利时布鲁塞尔
[25] 刘杰。;王凯。;Fung,B.C.M.,《在一个阶段中挖掘高效用模式而不生成候选模式》,IEEE Trans。知识。数据工程,28,5,1245-1257(2016)
[26] 刘,M。;Qu,J.,《在不生成候选项的情况下挖掘高效用项集》,《第二十一届ACM国际会议信息与知识管理会议论文集》,55-64(2012),美国HI毛伊岛
[27] 刘,Y。;Liao,W。;Choudhary,A.,一种快速高效的项集挖掘算法,ACM SIGKDD基于效用的数据挖掘研讨会(UBDM)国际会议论文集,253-262(2005)
[28] 卢,S。;胡,H。;Li,F.,挖掘加权关联规则,Intell。数据分析。,5, 3, 211-225 (2001) ·Zbl 1088.68576号
[29] 裴,J。;Han,J。;平托,H。;陈,Q。;Dayal,U。;Hsu,M.,PrefixSpan:通过前缀投影模式增长高效挖掘序列模式,第十七届IEEE国际会议数据工程会议论文集,215-224(2001),德国海德堡
[30] 沈毅。;杨琼。;Zhang,,面向对象的基于效用的关联挖掘,第二届IEEE国际会议数据挖掘会议记录,426-433(2002),日本前桥市
[31] 曾,F.S.C。;Kuo,Y.-H。;Huang,Y.-M.,通过数据去聚类促进分布式关联规则挖掘,Inf.Sci。(纽约),180,4263-4289(2010)
[32] Tseng,V.S。;Shie,B.E。;Wu,C.W。;Yu,P.S.,从事务数据库中挖掘高效用项集的高效算法,IEEE Trans。知识。数据工程,25,8,1772-1786(2013)
[33] Tseng,V.S。;吴昌伟。;Fournier-Viger,P。;Yu,P.S.,挖掘top-\(k)高效用项集的高效算法,IEEE Trans。知识。数据工程,28,1,54-67(2016)
[34] Tseng,V.S。;Wu,C.W。;Shie,B.E。;Yu,P.S.,UP-Growth:一种高效的高效用项集挖掘算法,第十六届ACM SIGKDD国际会议知识发现和数据挖掘会议论文集,253-262(2010),美国华盛顿特区
[35] 王,J。;Han,J。;卢,Y。;Tzvetkov,P.,TFP:一种高效的挖掘top-\(k)频繁闭项集的算法,IEEE Trans。知识。数据工程,17,5,652-664(2005)
[36] Wu,C.W。;谢,B.-E。;余,P.S。;Tseng,V.S.,《挖掘顶部-(k)高效用项目集》,第十八届ACM SIGKDD国际会议论文集,知识发现和数据挖掘,78-86(2012),中国北京
[37] Xin,D。;Cheng,H。;严,X。;Han,J.,提取冗余感知顶层模式,第十二届ACM SIGKDD国际会议知识发现和数据挖掘会议论文集,444-453(2006),美国宾夕法尼亚州费城
[38] 姚,H。;Hamilton,H.J.,从事务数据库挖掘项集实用程序,Data Knowl。工程,59,3,603-626(2006)
[39] 姚,H。;哈密尔顿·H·J。;Butz,C.J.,《从数据库中挖掘项目集实用程序的基本方法》,第四届SIAM国际会议数据挖掘会议记录,482-486(2004),美国佛罗里达州布埃纳维斯塔湖
[40] 姚,H。;哈密尔顿·H·J。;Geng,L.,挖掘项目集基于效用的度量的统一框架,ACM SIGKDD基于效用的数据挖掘研讨会(UBDM)国际会议论文集,28-37(2006)
[41] Zida,S。;Fournier-Viger,P。;林,J.C.-W。;吴昌伟。;Tseng,V.S.,EFIM:一种用于高效项集挖掘的快速内存高效算法,Knowl。信息系统。,51, 2, 595-625 (2017)
[42] Zihayat,M。;An,A.,挖掘数据流上的最高效用模式,Inf.Sci。(纽约),285,138-161(2014)·Zbl 1355.68237号
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。