×

基于基数约束的项集泛化。 (英语) Zbl 1355.68225号

概要:广义项集挖掘是一种成熟的数据挖掘技术,专注于发现大型数据库之间的高级关联。通过利用在数据项上构建的分类法,可以将项聚合为更高级别的概念,从而可以发现不同抽象级别上的数据关联。然而,由于可以提取大量模式,挖掘过程的结果往往不容易由领域专家管理。
我们提出了一种从结构化数据中发现广义项集紧子集的新方法。为了保证模型的简洁性和可读性,只有当项目集的基数很小,以至于手动检查实际上可行时,才会生成一组具有通用性的项目集。此外,泛化只有在其知识被大量低级派生项集覆盖时才会生成,只有在这些情况下,泛化才值得考虑,而不是其许多低级派生。
在从移动应用场景中获取的合成数据、基准数据和真实数据上进行的实验证明了所提出方法的有效性和效率。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] 阿格拉瓦尔,R。;伊米林斯基,T。;Swami,A.N.,大型数据库中项目集之间的关联规则挖掘,(1993年ACM SIGMOD国际数据管理会议论文集(1993),ACM出版社),207-216
[2] 阿格拉瓦尔,R。;Srikant,R.,大型数据库中挖掘关联规则的快速算法,(第20届VLDB会议论文集(1994年),ACM出版社),487-499
[3] 阿格拉瓦尔,R。;Srikant,R.,《挖掘广义关联规则》(VLDB 1995(1995),Morgan Kaufmann),407-419
[4] 阿格拉瓦尔,R。;Srikant,R.,《带项目约束的挖掘关联规则》(KDD 1997(1997),ACM出版社),67-73
[5] 阿尤比,S。;Muyeba,M.K。;Baraani,A。;Keane,J.,从表格数据中挖掘一般关联规则的算法,信息科学,179,3520-3539(2009)
[6] 巴尔迪,M。;Baralis,E。;Risso,F.,《用于有效和可扩展流量分析的数据挖掘技术》,(综合网络管理国际研讨会(2005),IEEE计算机学会),105-118
[7] Baralis,E。;卡利略,L。;Cerquitelli,T。;德埃利亚,V。;Garza,P.,支持驱动的广义项集抽取机会主义聚合,(第五届IEEE智能系统国际会议(2010),IEEE计算机学会),102-107
[8] Baralis,E。;卡利略,L。;Cerquitelli,T。;Garza,P.,带约束的广义关联规则挖掘,信息科学,194,68-84(2012)
[9] Baralis,E。;卡利略,L。;Cerquitelli,T。;Garza,P。;Marchetti,M.,《CAS-MINE:通过通用规则在上下文软件应用中提供个性化服务》,《知识和信息系统》,283-310(2010)
[10] Barsky,M。;Kim,S。;温inger,T。;Han,J.,从大型数据集中挖掘翻转相关性与分类,VLDB捐赠会议录,5370-381(2011)
[11] Bayardo,R.J.,从数据库中有效地挖掘长模式,(Haas,L.M.;Tiwary,A.,SIGMOD 1998(1998),ACM出版社),85-93
[13] 布林,S。;Motwani,R。;Silverstein,C.,《超越市场篮子:将关联规则推广到相关性》(SIGMOD 1997)。SIGMOD 1997,《国际数据管理会议论文集》(1997),ACM出版社,265-276
[14] Cagliero,L.,《发现分类法中的时间变化模式》,IEEE知识与数据工程汇刊,25,541-555(2013)
[15] 陈,E。;曹,H。;李强。;钱,T.,《基于严格聚合约束的序列模式挖掘的有效策略》,信息科学,1781498-1518(2008)·Zbl 1132.68629号
[16] Chen,Y.L。;Wu,S.Y。;Wang,Y.C.,在序列数据库中发现多标签时间模式,信息科学,181398-418(2011)
[18] Crémilleux,B。;Soulet,A.,从具有全球约束的局部模式中发现知识,(计算科学及其应用——ICCSA 2008,国际会议(2008),Springer),1242-1257
[20] Han,J。;Fu,Y.,在大型数据库中挖掘多级关联规则,IEEE知识与数据工程汇刊,11798-805(1999)
[21] 希茨勒,P。;Krötzsch,M。;Rudolph,S.,《语义网络技术基础》(2009),查普曼和霍尔/CRC
[23] Jaroszewicz,S。;Simovici,D.A.,使用贝叶斯网络作为背景知识的频繁项集的有趣性,(第十届ACM SIGKDD国际知识发现和数据挖掘会议论文集(2004),ACM出版社),178-186
[24] Kunkle,D。;张,D。;Cooperman,G.,《无冗余挖掘频繁广义项集和广义关联规则》,《计算机科学与技术杂志》,23,77-102(2008)
[25] 李毅。;朱,S。;Wang,X.S。;Jajodia,S.,《寻找时间的种子:发现大型事务集中的时间模式》,《信息科学》,1761003-1031(2006)·Zbl 1093.68084号
[26] 哺乳动物,M。;Tatti,N。;Vreeken,J.,告诉我我需要知道的:用项目集简洁地总结数据,(第17届ACM SIGKDD国际知识发现和数据挖掘会议论文集,KDD’11(2011),ACM出版社),573-581
[27] Mansingh,G。;Osei-Byson,K.M。;Reichgelt,H.,使用本体促进领域专家对关联规则的后处理,信息科学,181,419-434(2011)
[28] 莫洛伊,I。;陈,H。;李·T。;王,Q。;李,N。;E.贝尔蒂诺。;Calo,S。;Lobo,J.,《多目标挖掘角色》,《ACM信息和系统安全事务》(TISSEC),第13期,第1-35页(2010年)
[29] 北卡罗来纳州帕斯基尔。;巴斯蒂德,Y。;陶伊,R。;Lakhal,L.,发现关联规则的频繁闭项集,(第七届数据库理论国际会议论文集,ICDT’99(1999),Springer-Verlag),398-416
[30] Sriphaew,K。;Theeramunkong,T.,关联规则挖掘中发现广义频繁项集的新方法,(第七届计算机与通信国际研讨会论文集(2002),IEEE计算机学会),1040-1045
[31] Sriphaew,K。;Theeramunkong,T.,挖掘广义关联规则广义频繁模式的快速算法,IEICE信息与系统事务,87761-770(2004)
[32] Tan,P.N。;斯坦巴赫,M。;库马尔,V.,《数据挖掘导论》(2005),艾迪森·韦斯利
[33] Tatti,N.,《可能是最好的项目集》(第16届ACM知识发现和数据挖掘国际会议论文集(2010),ACM出版社),293-302
[34] 曾,S。;Tsui,C.,挖掘移动网络环境中的多级和位置感知服务模式,IEEE系统、人类和控制论汇刊,3422480-2485(2004)
[35] Uno,T。;Kiyomi,M。;Arimura,H.,Lcm第3版:数组、位图和前缀树的协作用于频繁项集挖掘,(第一届开源数据挖掘国际研讨会论文集:频繁模式挖掘实现,OSDM’05(2005),ACM出版社),77-86
[36] Zaki,M.J。;肖长杰,挖掘闭项集及其格结构的高效算法,IEEE知识与数据工程汇刊,17462-478(2005)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。