×

项集挖掘:约束编程视角。 (英语) Zbl 1353.68233号

摘要:数据挖掘领域已经习惯于指定感兴趣模式的约束。为了解决这种基于约束的挖掘问题,特别是挖掘项目集,已经开发了大量的系统和技术。数据挖掘领域所采用的方法与人工智能界开发的约束编程原则形成了对比。虽然大多数数据挖掘研究侧重于算法问题,旨在开发针对特定任务定制的高度优化和可伸缩的实现,但约束编程采用了更具声明性的方法。重点在于开发高级建模语言和通用求解器,以指定问题是什么,而不是概述应如何计算解决方案,并且其功能强大,足以在各种应用程序和应用程序域中使用。
本文提出了一种用于数据挖掘的声明性约束编程方法。更具体地说,我们表明可以使用离线约束编程技术来建模和解决各种基于约束的项集挖掘任务,例如频繁、封闭、区分和基于成本的项集开采。特别地,我们开发了一个用于指定频繁项集的基本约束编程模型,并表明该模型可以很容易地扩展以实现其他设置。这与典型的过程数据挖掘系统形成了对比,在该系统中,需要修改底层过程以适应新类型的约束或其新组合。即使最先进的数据挖掘系统在某些标准任务上的性能优于约束编程方法,我们还表明,与最先进的数据挖掘方法相比,约束编程方法在性能上有了显著的改进,并且对潜在的数据挖掘问题有了新的见解。通过将数据挖掘和约束编程系统的底层搜索算法相互关联,可以获得许多这样的见解。我们讨论了数据挖掘的声明性约束编程方法提出的一些有趣的新研究问题和挑战。

MSC公司:

68T05型 人工智能中的学习和自适应系统
68T20型 人工智能背景下的问题解决(启发式、搜索策略等)
PDF格式BibTeX公司 XML格式引用
全文: 内政部 链接

参考文献:

[1] 拉凯什·阿格拉瓦尔;托马斯·伊米林斯基(Tomasz Imielinski);Swami,Arun N.,大型数据库中项目集之间的关联规则挖掘,(ACM SIGMOD国际数据管理会议论文集(1993),ACM出版社),207-216
[2] 拉凯什·阿格拉瓦尔;Mannila,Hiekki;拉马克里什南·斯里坎特;汉努·托沃宁;Inkeri Verkamo,A.,关联规则的快速发现,(《知识发现和数据挖掘进展》(1996),AAAI出版社),307-328
[3] 阿普特,Krzysztof R。;Wallace,Mark,《使用Eclipse的约束逻辑编程》(2007),剑桥大学出版社:剑桥大学出版社,纽约州纽约市,美国·Zbl 1119.68044号
[4] 斯蒂芬·D·贝(Stephen D.Bay)。;Michael J.Pazzani,《检测分类数据中的变化:挖掘对比集》,(第五届知识发现和数据挖掘国际会议论文集(1999),ACM出版社),302-306
[5] 罗伯托·巴亚多(Roberto J.Bayardo)。;阿格拉瓦尔,拉凯什;Gunopulos,Dimitrios,大型密集数据库中基于约束的规则挖掘,数据挖掘和知识发现,4,2/3,217-240(2000)
[6] 尼古拉斯·贝尔迪塞努(Nicolas Beldiceanu);卡尔森,Mats;索菲·德马西;Petit,Thierry,《全球约束目录:过去、现在和未来》,约束,12,21-62(2007年3月)·兹比尔1128.68092
[7] 贝西埃,基督徒;埃曼纽尔·希伯拉德;O'Sullivan,Barry,最小化决策树大小作为组合优化,(约束编程的原理和实践。约束编程的原则和实践,计算机科学讲义,第5732卷(2009),Springer),173-187
[8] 弗朗西斯科·邦奇;Goethals,Bart,FP-bonsai:生长和修剪小FP-trees的艺术,(《知识发现和数据挖掘的进展》,《知识发现与数据挖掘进展》,计算机科学讲义,第3056卷(2004),Springer),155-160
[9] 弗朗西斯科·邦奇;Claudio Lucchese,《扩展基于约束的模式发现的最新技术》,《数据与知识工程》,60,2,377-399(2007)
[10] Sally C.Brailsford。;克里斯·波茨(Chris N.Potts)。;Barbara M.Smith,《约束满足问题:算法和应用》,《欧洲运筹学杂志》,119,3557-581(1999)·兹比尔0938.90055
[11] 克里斯蒂安·布西拉;约翰·盖尔克(Johannes Gehrke);丹尼尔·基弗(Daniel Kifer);White,Walker M.,DualMiner:带约束项集的双调整算法,数据挖掘与知识发现,7,3,241-272(2003)
[12] 张明伟;拉蒂诺夫,列夫·阿里;尼古拉斯·里佐洛(Nicholas Rizzolo);丹·罗斯(Roth,Dan),《带约束的学习与推理》(Learning and inference with constraints),《第二十三届美国人工智能学会人工智能会议论文集》(2008),美国人工智能出版社,1513-1518
[13] 程红;阎喜峰;韩嘉伟;徐志伟,有效分类的判别频繁模式分析,(第23届国际数据工程会议论文集(2007),IEEE),716-725
[14] 程红;阎喜峰;韩嘉伟;Yu,P.S.,有效分类的直接判别模式挖掘,(第24届国际数据工程会议论文集(2008),IEEE),169-178
[15] James Cussens,《通过编译到加权max-sat的贝叶斯网络学习》,(《第24届人工智能不确定性会议论文集》(2008),AUAI出版社),105-112
[16] Luc De Raedt;枪支,蒂亚斯;Nijssen,Siegfried,项集挖掘的约束编程,(第14届ACM SIGKDD国际知识发现和数据挖掘会议(2008),ACM),204-212·Zbl 1353.68233号
[17] Luc De Raedt;枪支,蒂亚斯;Nijssen,Siegfried,《数据挖掘和机器学习的约束编程》,(第二十四届AAAI人工智能会议论文集(2010),AAAI出版社),1513-1518·Zbl 1353.68233号
[18] Luc De Raedt;Kramer,Stefan,水平版本空间算法及其在分子片段发现中的应用,(第十七届国际人工智能联合会议论文集(2001),Morgan Kaufmann),853-862
[19] Luc De Raedt;Zimmermann,Albrecht,基于约束的模式集挖掘,(第七届SIAM国际数据挖掘会议论文集(2007),SIAM),1-12
[20] 董国柱;李金燕,《新兴模式的有效挖掘:发现趋势和差异》,(第五届知识发现与数据挖掘国际会议论文集,1999年),美国计算机学会出版社,43-52
[21] 范伟;张坤;程红;高静;阎喜峰;韩嘉伟;Yu,Philip S。;Verscheure,Olivier,通过基于模型的搜索树直接挖掘判别和基本频繁模式,(第14届ACM SIGKDD知识发现和数据挖掘国际会议论文集(2008),ACM),230-238
[22] 艾伦·M·弗里希(Alan M.Frisch)。;格鲁姆,马修;克里斯托弗·杰斐逊;马丁内斯·埃尔南德斯(Martínez Hernández),伯纳黛特(Bernadette);Ian Miguel,《本质的设计:指定组合问题的约束语言》(The design of essention:a constraint language for specification combination problems)(《第20届国际人工智能联合会议论文集》(2007),摩根·考夫曼),第80-87页
[23] 约翰·范克兰茨(Johannes Fürnkranz);Flach,Peter A.,ROC‘n’规则学习-更好地理解覆盖算法,机器学习,58,1,39-77(2005)·Zbl 1075.68071号
[24] (甘特,伯恩哈德;斯图姆,格德;威勒,鲁道夫,《形式概念分析,基础和应用》,《形式理念分析,基础与应用》,计算机科学讲义,第3626卷(2005),施普林格)·Zbl 1087.68003号
[26] 伊恩·詹特(Ian P.Gent)。;克里斯托弗·杰斐逊;Miguel,Ian,《MINION:一种快速可扩展的约束求解器》,(第17届欧洲人工智能会议论文集(2006),IOS出版社),98-102
[27] Bart Goethals,Mohammed J.Zaki,《频繁项集挖掘实现的进展:FIMI’03报告》,载于:SIGKDD Explorations Newsletter,第6卷,2004年,第109-117页。;Bart Goethals,Mohammed J.Zaki,《频繁项集挖掘实现的进展:FIMI’03报告》,载于:SIGKDD Explorations Newsletter,第6卷,2004年,第109-117页。
[28] 亨利克·格罗斯克鲁兹(Henrik Grosskreutz);吕平、斯特凡;Wrobel,Stefan,快速子组发现的严格乐观估计,(数据库中的机器学习和知识发现。数据库中的计算机学习和知识探索,计算机科学讲义,第5211卷(2008年),Springer),440-456
[29] 蒂亚斯·冈斯(Tias Guns)、齐格弗里德·尼杰森(Siegfried Nijssen)、吕克·德·雷德(Luc De Raedt),(k);蒂亚斯·冈斯、齐格弗里德·尼杰森、吕克·德·雷德·Zbl 1211.68142号
[30] Han,J。;裴,J。;Yin,Y.,无候选生成的频繁模式挖掘,(ACM SIGMOD国际数据管理会议论文集(2000),ACM出版社),1-12
[31] 韩嘉伟;程红;Xin,Dong;严喜峰,《频繁模式挖掘:现状与未来方向》,《数据挖掘与知识发现》,第15、1、55-86页(2007)
[32] 布兰科·卡夫塞克;纳达·拉夫拉克;Jovanoski,Viktor,APRIORI-SD:将关联规则学习应用于子组发现,(智能数据分析的进展。智能数据分析进展,计算机科学讲义,第2810卷(2003),Springer),230-241
[33] 曼尼拉,海基;Toivonen,Hannu,知识发现中的水平搜索和理论边界,数据挖掘和知识发现,1,3,241-258(1997)
[34] 森本康彦;福田武史;松泽、博文;德山武史;Yoda,Kunikazu,大型分类数据库二进制分割关联规则挖掘算法,(第24届超大数据库国际会议论文集(1998),Morgan Kaufmann),380-391
[35] 森田,新一;Sese,Jun,带统计度量修剪的遍历项集格,(第十九届ACM SIGMOD-SIGACT-SIGART数据库系统原理研讨会论文集(2000),ACM),226-236
[36] 齐格弗里德·尼杰森;Fromont,Elisa,从项集格中归纳基于约束的最优决策树,数据挖掘与知识发现,21,1,9-51(2010)
[37] 尼克森,齐格弗里德;Guns,Tias,《集成约束编程和项集挖掘》,(数据库中的机器学习和知识发现。数据库中的计算机学习和知识探索,计算机科学讲稿,第6322卷(2010年),Springer),467-482·Zbl 1353.68233号
[38] 齐格弗里德·尼杰森;枪支,蒂亚斯;De Raedt,Luc,《ROC空间中的相关项集挖掘:一种约束编程方法》,(第15届ACM SIGKDD国际知识发现和数据挖掘会议论文集(2009),ACM),647-656·Zbl 1353.68233号
[39] 尼克森,齐格弗里德;Kok,Joost N.,多类相关模式挖掘,(归纳数据库中的知识发现。归纳数据库中知识发现,计算机科学讲义,第3933卷(2005),Springer),165-187·Zbl 1178.68206号
[40] 尼古拉斯·帕斯基尔(Nicolas Pasquier);巴斯蒂德,伊夫斯;拉菲克·陶伊;Lakhal,Lotfi,发现关联规则的频繁闭项集,(数据库理论,数据库理论,计算机科学讲义,第1540卷(1999),Springer),398-416·Zbl 0983.68511号
[41] 裴健;韩佳伟,我们能在频繁模式挖掘中加入更多约束吗?,(第六届ACM SIGKDD知识发现和数据挖掘国际会议论文集(2000),ACM),350-354
[42] 裴健;韩嘉伟;Lakshmanan,Laks V.S.,《使用可转换约束挖掘频繁项集》(IEEE国际数据工程会议论文集(2001),IEEE),433-442
[43] 裴健;韩嘉伟;Mao,Runying,Closet:挖掘频繁闭合项集的有效算法,(ACM SIGMOD数据挖掘和知识发现研究问题研讨会(2000),ACM),21-30
[44] Perron,Laurent,约束编程中的搜索过程和并行,(约束编程的原理和实践。约束编程的原则和实践,计算机科学讲义,第1713卷(1999),Springer),346-360
[45] 弗朗西丝卡·罗西;彼得·范·比克(Peter van Beek);Walsh,Toby,《约束编程手册(人工智能基础)》(2006),爱思唯尔科学公司·Zbl 1175.90011号
[46] Christian Schulte,《编程约束服务:标准和新约束服务的高级编程》,《计算机科学讲义》,第2302卷(2002),Springer·Zbl 0994.68038号
[47] 舒尔特(Christian Schulte);Stuckey,Peter J.,《高效约束传播引擎》,《编程语言和系统事务》,31,1,1-43(2008)
[48] Sese,Jun;Morishita,Shinichi,高效地回答最相关的关联规则,(数据挖掘和知识发现原理。数据挖掘与知识发现原理,计算机科学讲义,第2431卷(2002),Springer),410-422·Zbl 1020.68886号
[49] Shenoy,Pradeep;Jayant R.哈里萨。;Sudarshan,S。;高拉夫·巴洛蒂亚;巴瓦,马延克;Devavrat,Shah,大型数据库的涡轮增压垂直挖掘(2000年ACM SIGMOD国际数据管理会议论文集(2000年),ACM),22-33
[50] 阿诺·苏莱特;Crömilleux,Bruno,《挖掘灵活约束的有效框架》,(《知识发现和数据挖掘的进展》,《知识发现与数据挖掘进展》,计算机科学讲稿,第3518卷(2005),Springer),43-64
[51] Uno,Takeaki;清明,Masashi;Arimura,Hiroki,LCM第3版:数组、位图和前缀树的协作用于频繁项集挖掘,(第一届开源数据挖掘国际研讨会论文集(2005),ACM),77-86
[52] 范·亨特利克(Van Hentenryck),帕斯卡(Pascal);伊夫·德维尔(The Cardinality Operator:A New Logical Connective for Constraint Logic Programming,1993),麻省理工学院出版社:麻省理学院出版社,剑桥,美国),383-403
[53] 范·亨特利克(Van Hentenryck),帕斯卡(Pascal);劳伦·佩伦(Laurent Perron);Puget,Jean-Francois,OPL中的搜索和策略,ACM事务计算逻辑,1,2,285-320(2000)·Zbl 1365.90281号
[54] 范·亨特利克(Van Hentenryck),帕斯卡(Pascal);Vijay A.Saraswat。;Deville,Yves,约束语言cc(FD)的设计、实现和评估,逻辑编程杂志,37,1-3139-164(1998)·Zbl 0920.68026号
[55] Wrobel,Stefan,子群多关系发现的算法,(数据挖掘和知识发现原理。数据挖掘与知识发现原理,计算机科学讲义,第1263卷(1997),Springer),78-87
[56] 穆罕默德·贾维德·扎基;Gouda,Karam,使用差异集进行快速垂直挖掘,(第九届ACM SIGKDD国际知识发现和数据挖掘会议论文集(2003),ACM),326-335
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。