×

使用蒙特卡罗树搜索随时发现一组不同的模式。 (英语) Zbl 1411.68132号

摘要:发现准确区分类别标签的模式仍然是一项具有挑战性的数据挖掘任务。子组发现(SD)是能够从标记数据中引出此类有趣模式的框架之一。一个相当开放的问题是:当模式空间的穷举枚举不可行时,如何选择准确的启发式搜索技术?现有的方法利用波束搜索、采样和遗传算法来发现非冗余的高质量模式集。我们认为,这种方法产生的模式集缺乏多样性:只有少数高质量且差异足够大的模式被发现。然后,我们的主要贡献是将模式挖掘正式定义为一个游戏,并使用蒙特卡洛树搜索(MCTS)解决它。它可以被视为一个由随机模拟引导的穷尽搜索,由于其最佳优先搜索属性。我们通过一组全面的实验展示了MCTS如何能够随时发现高质量的多样模式集。在处理大型模式搜索空间和不同质量度量时,它优于其他方法。由于它的通用性,我们的MCTS方法可以用于SD,也可以用于许多其他模式挖掘任务。

理学硕士:

68吨10 模式识别、语音识别
68T05型 人工智能中的学习和自适应系统
68T20型 人工智能背景下的问题解决(启发式、搜索策略等)

软件:

NMEEF-SD公司
PDF格式BibTeX公司 XML格式引用

参考文献:

[1] Abramson B(1990)《预期产出:静态评估的一般模型》。IEEE Trans-Pattern Ana Mach Intell 12(2):182-193。https://doi.org/10.109/34.44404 ·doi:10.1109/34.44404
[2] Abudawood T,Flach PA(2009)多类亚组发现的评估措施。In:Buntine WL,Grobelnik M,Mladenic D,Shawe Taylor J(eds)In:数据库中的机器学习和知识发现,欧洲会议,ECML PKDD 2009,Bled,斯洛文尼亚,2009年9月7日至11日,Proceedings,Part I,Springer,《计算机科学讲义》,第5781卷,第35-50页。https://doi.org/10.1007/978-3-642-04180-8_20
[3] Atzmüller M,Lemmerich F(2009)连续目标概念的快速子组发现。收件人:Rauch J、Ras ZW、Berka P、Elomaa T(eds)智能系统基础,第18届国际研讨会,ISMIS 2009,捷克共和国布拉格,2009年9月14-17日。斯普林格学报,计算机科学讲稿,第5722卷,第35-44页。https://doi.org/10.1007/978-3642-04125-9_7
[4] Atzmüller M,Puppe F(2006)Sd-map-穷举子组发现的快速算法。收录于:Fürnkranz J,Scheffer T,Spiliopoulou M(eds)《数据库中的知识发现:PKDD 2006》,第十届欧洲数据库知识发现原理与实践会议,德国柏林,2006年9月18日至22日,《Springer学报》,《计算机科学讲稿》,第4213卷,第6-17页。https://doi.org/10.1007/11871637_6
[5] Auer P、Cesa Bianchi N、Fischer P(2002)《多武装匪徒问题的有限时间分析》。马赫数学习47(2-3):235-256。https://doi.org/10.1023/A:1013689704352 ·Zbl 1012.68093号 ·doi:10.1023/A:1013689704352
[6] Belfodil A、Kuznetsov SO、Robardet C、Kaytoue M(2017)《利用形式概念分析挖掘凸多边形模式》。参见:Sierra C(ed)《第二十六届国际人工智能联合会议论文集》,2017年8月19日至25日,澳大利亚墨尔本,IJCAI.org,第1425-1432页。https://doi.org/10.24963/ijcai.2017/197
[7] Bendimerad AA、Plantevit M、Robardet C(2016)城市数据中的非监督异常属性子图挖掘。收录于:Bonchi F、Domingo-Ferrer J、Baeza-Yates RA、Zhou Z、Wu X(编辑)IEEE第16届数据挖掘国际会议,2016年12月12日至15日,西班牙巴塞罗那,IEEE,第21-30页。https://doi.org/10.109/ICDM.2016.0013
[8] Björnsson Y,Finnsson H(2009)Cadiaplayer:基于模拟的通用游戏玩家。IEEE Trans-Comput Intell AI游戏1(1):4-15。https://doi.org/10.109/TCIAIG.2009.2018702 ·doi:10.1109/TCIAIG.2009.2018702
[9] Boley M,Lucchese C,Paurat D,Gärtner T(2011)通过有效的两步随机程序进行直接局部模式采样。载于:AptéC、Ghosh J、Smyth P(eds)《第17届ACM SIGKDD知识发现和数据挖掘国际会议论文集》,2011年8月21日至24日,美国加利福尼亚州圣地亚哥,ACM,第582-590页。https://doi.org/10.1145/2020408.2020500
[10] Bosc G、Golebiowski J、Bensafi M、Robardt C、Plantevit M、Boulicaut J、Kaytoue M(2016)《激发和理解新结构-或关系的局部亚群发现》。收录于:Calders T、Ceci M、Maleba D(eds)Discovery science-196年国际会议,DS 2016,巴里,意大利,2016年10月19-21日,计算机科学会议记录,第9956卷,第19-34页。https://doi.org/10.1007/978-3-319-46307-0_2
[11] Boulicaut,J。;杰迪,B。;Maimon,O.(编辑);Rokach,L.(编辑),基于约束的数据挖掘,339-354(2010),柏林·doi:10.1007/978-0-387-09823-4_17
[12] Bringmann B,Zimmermann A(2009)百万分之一:选择正确的模式。知识信息系统18(1):61-81。https://doi.org/10.1007/s10115-008-0136-4网址 ·数字对象标识代码:10.1007/s10115-008-0136-4
[13] Browne C、Powley EJ、Whitehouse D、Lucas SM、Cowling PI、Rohlfshagen P、Tavener S、Liebana DP、Samothrakis S、Colton S(2012)蒙特卡洛树搜索方法调查。IEEE Trans-Comput Intell AI游戏4(1):1-43。https://doi.org/10.109/TCIAIG.2012.2186810 ·doi:10.1109/TCIAIG.2012.2186810
[14] Carmona CJ,González P,del Jesüs MJ,Herrera F(2010)NMEEF-SD:在子组发现中提取模糊规则的非支配多目标进化算法。IEEE Trans Fuzzy系统18(5):958-970。https://doi.org/10.109/TFUZZ.2010.2060200 ·doi:10.1109/TFUZZ.2010.2060200
[15] del Jesüs MJ、González P、Herrera F、Mesonero M(2007)《子组发现的进化模糊规则归纳过程:营销案例研究》。IEEE Trans Fuzzy系统15(4):578-592。https://doi.org/10.109/TFUZZ.2006.890662 ·doi:10.1109/TFUZZ.2006.890662
[16] Downar L,Duivesteijn W(2017)异常单调模型——用于异常模型挖掘的秩相关模型类。知识信息系统51(2):369-394。https://doi.org/10.1007/s10115-016-0979-z ·doi:10.1007/s10115-016-0979-z
[17] Duivesteijn W,Knobbe AJ(2011)利用虚假发现-亚组发现中模式和质量度量的统计验证。作者:Cook DJ、Pei J、Wang W、Zaiane OR、Wu X(eds)第11届IEEE数据挖掘国际会议,ICDM 2011,加拿大不列颠哥伦比亚省温哥华,2011年12月11-14日,IEEE计算机学会,第151-160页。https://doi.org/10.109/ICDM.2011.65
[18] Duivesteijn W、Knobbe AJ、Feelders A、van Leeuwen M(2010),子组发现与贝叶斯网络相结合,这是一种特殊的模型挖掘方法。摘自:Webb GI、Liu B、Zhang C、Gunopulos D、Wu X(eds)ICDM 2010,第十届ieee数据挖掘国际会议,澳大利亚悉尼,2010年12月14日至17日,ieee计算机学会,第158-167页。https://doi.org/10.109/ICDM.2010.53
[19] Duivesteijn W,Feelders A,Knobbe AJ(2016)《特殊模型挖掘——具有复杂目标概念的描述性局部模式挖掘》。数据最小知识发现30(1):47-98。https://doi.org/10.1007/s10618-015-0403-4 ·Zbl 1411.68096号 ·文件编号:10.1007/s10618-015-0403-4
[20] Egho E、Gay D、BouléM、Voisine N、Clérot F(2015)挖掘稳健序列分类规则的无参数方法。收件人:Aggarwal CC,Zhou Z,Tuzhilin A,Xiong H,Wu X(eds)2015 IEEE国际数据挖掘会议,ICDM 2015,美国新泽西州大西洋城,2015年11月14-17日,IEEE计算机学会,第745-750页。https://doi.org/10.109/ICDM.2015.87
[21] Egho E、Gay D、BouléM、Voisine N、Clérot F(2017)一种用于挖掘稳健序列分类规则的用户无参数方法。知识信息系统52(1):53-81。https://doi.org/10.1007/s10115-016-1002-4 ·doi:10.1007/s10115-016-1002-4
[22] Fürnkranz J、Gamberger D、Lavrac N(2012)《规则学习基础》。认知技术。柏林施普林格。https://doi.org/10.1007/978-3-540-75197-7 ·Zbl 1263.68002号 ·doi:10.1007/978-3-540-75197-7
[23] Gaudel R,Sebag M(2010)作为一款单人游戏的特色选择。摘自:Fürnkranz J,Joachims T(eds)《第27届国际机器学习会议(ICML-10)论文集》,2010年6月21日至24日,以色列海法,Omnipress,第359-366页。http://www.icml2010.org/papers/247.pdf
[24] Gay D,BouléM(2012)定量数据库中分类规则挖掘的贝叶斯方法。In:Flach PA,Bie TD,Cristianini N(eds)数据库中的机器学习和知识发现-欧洲会议,ECML PKDD 2012,英国布里斯托尔,2012年9月24-28日。论文集,第二部分,施普林格,计算机科学讲义,第7524卷,第243-259页。https://doi.org/10.1007/978-3-642-33486-3_16
[25] Gelly S,Silver D(2007)结合UCT中的在线和离线知识。收录于:Ghahramani Z(ed)机器学习,第二十四届国际会议论文集(ICML 2007),美国俄勒冈州科瓦利斯,2007年6月20日至24日,ACM,ACM国际会议论文系列,第227卷,第273-280页。https://doi.org/10.1145/1273496.1273531
[26] Grosskreutz H,Rüping S,Wrobel S(2008)快速子组发现的严格乐观估计。收录于:Daelemans W、Goethals B、Morik K(编辑)《数据库中的机器学习和知识发现》,欧洲会议,ECML/PKDD 2008,比利时安特卫普,2008年9月15日至19日,《计算机科学论文集》,第一部分,Springer,第5211卷,第440-456页。https://doi.org/10.1007/978-3-540-87479-9_47
[27] 韩J,裴J,尹Y(2000)挖掘无候选代的频繁模式。收录人:Chen W,Naughton JF,Bernstein PA(编辑)2000年ACM SIGMOD国际数据管理会议记录,2000年5月16日至18日,美国德克萨斯州达拉斯,ACM,第1-12页。https://doi.org/10.1145/342009.335372
[28] Han J,Pei J,Yin Y,Mao R(2004)无候选生成的频繁模式挖掘:一种频繁模式树方法。数据最小知识发现8(1):53-87。https://doi.org/10.1023/B:DAMI.0000005258.31418.83 ·doi:10.1023/B:DAMI.0000005258.31418.83
[29] Helmbold DP,Parker-Wood A(2009)《Monte-Carlo go中的所有动作作为第一个启发式》。收件人:Arabnia HR,de la Fuente D,Olivas JA(eds)2009年国际人工智能会议记录,ICAI 2009年7月13日至16日,美国内华达州拉斯维加斯,2卷,CSREA出版社,第605-610页
[30] Holland JH(1975)《自然和人工系统的适应:生物学、控制和人工智能应用的介绍性分析》。密歇根大学出版社,安娜堡·Zbl 0317.68006号
[31] Kavsek B,Lavrac N(2006)APRIORI-SD:将关联规则学习应用于子组发现。应用Artif Intell 20(7):543-583。https://doi.org/10.1080/08839510600779688 ·doi:10.1080/08839510600779688
[32] Kaytoue M、Kuznetsov SO、Napoli A(2011年)《利用形式概念分析重新审视数字模式挖掘》。摘自:沃尔什(2011),第1342-1347页。https://doi.org/10.5591/978-1-57735-516-8/IJCAI11-227
[33] Kaytoue M,Plantevit M,Zimmermann A,Bendimerad AA,Robardet C(2017)异常上下文子图挖掘。马赫学习106(8):1171-1211。https://doi.org/10.1007/s10994-016-5598-0 ·Zbl 1458.05246号 ·doi:10.1007/s10994-016-5598-0
[34] 克洛斯根,W。;法耶兹,UM(编辑);Piatetsky Shapiro,G.(编辑);Smyth,P.(编辑);Uthurusamy,R.(编辑),Explora:多模式和多策略发现助理,249-271(1996),剑桥
[35] Kocsis L,Szepesvári C(2006)基于Bandit的蒙特卡罗规划。收录于:Fürnkranz J,Scheffer T,Spiliopoulou M(eds)《机器学习:ECML 2006》,第17届欧洲机器学习会议,德国柏林,2006年9月18日至22日,《Springer论文集》,《计算机科学讲稿》,第4212卷,第282-293页。https://doi.org/10.1007/11871842_29
[36] Lavrac N,Flach PA,Zupan B(1999)《规则评估措施:统一观点》。摘自:Dzeroski S,Flach PA(eds)Inductive logic programming,第九届国际研讨会,ILP-99,Bled,斯洛文尼亚,1999年6月24-27日,Springer,Proceedings,Telection Notes In Computer Science,vol 1634,pp 174-185。https://doi.org/10.1007/3-540-48751-4_17
[37] Lavrac N、Cestnik B、Gamberger D、Flach PA(2004),通过亚组发现提供决策支持:三个案例研究和经验教训。马赫数学习57(1-2):115-143。https://doi.org/10.1023/B:MACH.0000035474.48771.cd ·Zbl 1078.68753号 ·doi:10.1023/B:MACH.0000035474.48771.cd
[38] Leman D、Feelders A、Knobbe AJ(2008)《卓越模型挖掘》。收录于:Daelemans W、Goethals B、Morik K(编辑)《数据库中的机器学习和知识发现》,欧洲会议,ECML/PKDD 2008,比利时安特卫普,2008年9月15日至19日,《程序集》,第二部分,Springer,《计算机科学讲义》,第5212卷,第1-16页。https://doi.org/10.1007/978-3-540-87481-2_1 ·Zbl 1231.68206号
[39] Lemmerich F,Atzmueller M,Puppe F(2016)使用数值目标概念快速穷举子组发现。数据最小知识发现30(3):711-762。https://doi.org/10.1007/s10618-015-0436-8 ·Zbl 1411.68113号 ·doi:10.1007/s10618-015-0436-8
[40] Lowere BT(1976)harpy语音识别系统。宾夕法尼亚州匹兹堡卡内基梅隆大学计算机科学系博士论文
[41] Lucas T、Silva TCPB、Vimieiro R、Ludermir TB(2017)一种新的进化算法,用于挖掘高维数据中的top-k区分模式。应用软计算59:487-499。https://doi.org/10.1016/j.asoc.2017.05.048 ·doi:10.1016/j.asoc.2017.05.048
[42] Meeng M,Duivesteijn W,Knobbe AJ(2014),Rocsearch-an roc-guided search strategy for subgroup discovery。收录人:Zaki MJ、Obradovic Z、Tan P、Banerjee A、Kamath C、Parthasarathy S(eds)《2014年SIAM数据挖掘国际会议论文集》,美国宾夕法尼亚州费城,2014年4月24日至26日,SIAM,第704-712页。https://doi.org/10.1137/1.9781611973440.81
[43] Moens S,Boley M(2014)使用加权控制模式采样的即时异常模型挖掘。In:Blockeel H,van Leeuwen M,Vinciotti V(eds)Advances In intelligent data analysis XIII-13th international symposium,IDA 2014,Leuven,Belgium,2014年10月30日-11月1日。斯普林格学报,《计算机科学讲义》,第8819卷,第203-214页。https://doi.org/10.1007/978-3-319-12571-8_18
[44] Mueller M、Rosales R、Steck H、Krishnan S、Rao B、Kramer S(2009)试验选择的亚组发现:一种新方法及其在乳腺癌诊断中的应用。摘自:Adams NM、Robardet C、Siebes A、Boulicaut J(eds)Advances In intelligent data analysis VIII,第八届国际智能数据分析研讨会,IDA 2009,里昂,法国,2009年8月31日至9月2日。《计算机科学讲义》,第5772卷,第119-130页。https://doi.org/10.1007/978-3642-03915-7_11
[45] Novak PK、Lavrac N、Webb GI(2009)《监督描述性规则发现:对比集、新兴模式和子组挖掘的统一调查》。J Mach学习研究10:377-403。https://doi.org/10.1145/1577069.1577083 ·Zbl 1235.68178号 ·doi:10.1145/1577069.1577083
[46] Pachón V,Vázquez JM,Domínguez JL,López MJM(2011)《子群发现的多目标进化方法》。收录于:Corchado E、Kurzynski M、Wozniak M(eds)Hybrid artificial intelligence systems-6th international conference,HAIS 2011,Wroclaw,Poland,May 23-25,2011,Proceedings,Part II,Springer,Telection Notes In Computer Science,vol 6679,pp 271-278。https://doi.org/10.1007/978-3-642-21222-2_33
[47] Rodríguez D、Ruiz R、Riquelme JC、Aguilar-Ruiz JS(2012)《搜索规则以检测缺陷模块:子组发现方法》。《信息科学》191:14-30。https://doi.org/10.1016/j.ins.2011.01.039 ·doi:10.1016/j.ins.2011.01.039
[48] Russell SJ,Norvig P(2010)《人工智能——现代方法》(3)。国际。d)。培生教育。http://vig.pearsoned.com/store/product/1,1207,存储-12521_isbn-0136042597,00.html·Zbl 0835.68093号
[49] Schadd MPD、Winands MHM、van den Herik HJ、Chaslot G、Uiterwijk JWHM(2008)《单层蒙特卡罗树搜索》。作者:van den Herik HJ,Xu X,Ma Z,Winands MHM(eds)Computers and games,第六届国际会议,CG 2008,中国北京,2008年9月29日至10月1日。斯普林格学报,计算机科学讲稿,第5131卷,第1-12页。https://doi.org/10.1007/978-3-540-87608-3_1
[50] Silver D、Huang A、Maddison CJ、Guez A、Sifre L、van den Driessche G、Schrittwiser J、Antonoglou I、Panneershelvam V、Lanctot M、Dieleman S、Grewe D、Nham J、Kalchbrenner N、Sutskever I、Lillicrap TP、Leach M、Kavukcuoglu K、Graepel T、Hassabis D(2016)通过深度神经网络和树搜索掌握围棋游戏。自然529(7587):484-489·doi:10.1038/nature16961
[51] van Leeuwen M,Galbrun E(2015),双视图数据中的关联发现。IEEE Trans Knowl Data Eng 27(12):3190-3202。https://doi.org/10.109/TKDE.2015.2453159 ·doi:10.1109/TKDE.2015.2453159
[52] van Leeuwen M,Knobbe AJ(2011)大型复杂数据中的非冗余亚组发现。收录于:Gunopulos D、Hofmann T、Maleba D、Vazirgiannis M(eds)数据库中的机器学习和知识发现——欧洲会议,ECML PKDD 2011,希腊雅典,2011年9月5日至9日,Proceedings,Part III,Springer,Leach Notes In Computer Science,vol 6913,pp 459-474。https://doi.org/10.1007/978-3-642-23808-6_30 ·兹比尔1222.68012
[53] van Leeuwen M,Knobbe AJ(2012)《多样性亚组集发现》。数据最小知识发现25(2):208-242。https://doi.org/10.1007/s10618-012-0273-y ·doi:10.1007/s10618-012-0273-y
[54] van Leeuwen M,Ukkonen A(2013)发现子组集合的天际线。在:Blockeel H,Kersting K,Nijssen S,Zelezny F(eds)数据库中的机器学习和知识发现欧洲会议,ECML PKDD 2013,捷克共和国布拉格,2013年9月23日至27日,《论文集》第三部分,施普林格,《计算机科学讲义》,第8190卷,第272-287页。https://doi.org/10.1007/978-3642-40994-3_18
[55] Walsh T(ed)(2011)IJCAI 2011,第22届国际人工智能联合会议论文集,巴塞罗那,加泰罗尼亚,西班牙,2011年7月16-22日,IJCAI/AAAI。http://ijcai.org/proceedings/2011
[56] Wrobel S(1997)子群的多关系发现算法。收录于:Komorowski HJ,Zytkow JM(eds)数据挖掘和知识发现原理,第一届欧洲研讨会,PKDD’97,挪威特隆赫姆,1997年6月24日至27日,施普林格会议录,计算机科学讲稿,第1263卷,第78-87页。https://doi.org/10.1007/3-540-63223-9_108
此参考列表基于出版商或数字数学图书馆提供的信息。它的项目与zbMATH标识符启发式匹配,并且可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。