×

一种基于BSC-树挖掘强跳跃新兴模式的新方法。 (英语) Zbl 1319.68179号

摘要:由于模式空间巨大,从高维数据集中发现强跳跃新兴模式(SJEP)是一个巨大的挑战。在本文中,我们提出了一种动态增长的对比度模式树(DGCP-tree)结构,用于存储生成的模式及其具有1位计数的路径码数组,这些模式来自构造的位字符串压缩树。提出了一种基于DGCP树的SJEP挖掘方法。为了减少模式搜索空间,我们引入了一种新的模式剪枝方法,大大减少了挖掘过程中的非最小跳跃新兴模式(JEP)。实验在三个真实的癌症数据集和三个来自加州大学欧文分校机器学习库的数据集上进行。结果表明,与著名的CP-树方法相比,该方法速度快得多,能够处理高维数据集,并且能够剪除更多非最小JEP。

理学硕士:

68T05型 人工智能中的学习和自适应系统
68吨10 模式识别、语音识别
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 数字对象标识码:10.1073/pnas.96.12.6745·doi:10.1073/pnas.96.12.6745
[2] Bailey,J,Manoukian,T和Ramamohanarao,K.,2002年。挖掘新兴模式的快速算法。第六届欧洲数据挖掘和知识发现原则会议记录,PKDD'02。2002年,第39-50页。英国伦敦:Springer-Verlag·Zbl 1020.68538号
[3] DOI:10.1080/10556789208805504·doi:10.1080/10556789208805504
[4] Chen X,《软件杂志》6第985页–(2011年)
[5] Cheng,H,Yan,X,Han,J和Yu,P S.2008。有效分类的直接判别模式挖掘。2008年IEEE第24届国际数据工程会议记录,ICDE'08。2008年,第169-178页。华盛顿特区,IEEE计算机协会
[6] 内政部:10.1080/18756891.2010.9727736·doi:10.1080/18756891.2010.9727736
[7] Dong,G和Li,J.1999年。高效挖掘新兴模式:发现趋势和差异。第五届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD’99。1999年,第43-52页。美国加利福尼亚州圣地亚哥。纽约州纽约市:ACM
[8] DOI:10.1007/s10115-004-0178-1·doi:10.1007/s10115-004-0178-1
[9] 内政部:10.1080/00207720903144545·Zbl 1291.93288号 ·doi:10.1080/00207720903144545
[10] DOI:10.1109/TKDE.2006.95·doi:10.1109/TKDE.2006.95
[11] DOI:10.1109/TKDE.2010.241·doi:10.1010/TKDE.2010.241
[12] Fayyad,U M和Irani,K B.1993年。分类学习中连续值属性的多区间离散化。第十三届国际人工智能联合会议记录。1993年,第1022–1029页。
[13] Gambin,T和Walczak,K.,2009年。根据影响最大的跳跃新兴模式进行分类。2009年国际计算机科学和信息技术会议记录。2009年,第37-42页。波兰姆拉戈沃
[14] García-Borroto,M,Martínez-Trinida,J F和Carrasco-Ochoa,J a.2010。一种新的新兴模式挖掘算法及其在监督分类中的应用。第14届亚太地区知识发现和数据挖掘进展会议记录——第一卷,PAKDD’10。2010年,第150–157页。印度海得拉巴。柏林,海德堡:施普林格出版社。
[15] DOI:10.1126/science.286.5439.531·doi:10.1126/science.286.5439.531
[16] Hippo Y,《癌症研究》62,第233页–(2002年)
[17] Jiang X R,数据与知识工程53,第3页–(2005)·doi:10.1016/j.datak.2004.06.011
[18] 科比林斯基,L和Walczak,K.,2010年。场景分类的空间新兴模式。第十届国际人工智能与软计算大会论文集:第一部分,ICAISC'10。2010年,第515-522页。
[19] Kobyliáski,L和Walczak,K.,2011年,《利用分类发生次数高效挖掘跳跃新兴模式》,第6499卷,第73–88页。柏林,海德堡:施普林格·Zbl 1185.68538号
[20] Li,J,Ramamohanarao,K和Dong,G.2000。跳跃空间新兴模式及其增量维护算法。第十七届机器学习国际会议论文集。2000年,第551-558页。加利福尼亚州旧金山:Morgan Kaufmann。
[21] DOI:10.1093/bioinformatics/18.5.725·doi:10.1093/bioinformatics/18.5.725
[22] 内政部:10.1080/00207720903141434·Zbl 1291.93298号 ·网址:10.1080/00207720903141434
[23] Liu Y C,《国际创新计算、信息与控制杂志》,第7页,第6041页–(2011年)
[24] DOI:10.1080/0207720600891760·Zbl 1125.92031号 ·doi:10.1080/00207720600891760
[25] Poezevara,G.Cuissart,B.和Crémilleux,B.(2009),“从化学品中发现新兴图形模式”,摘自第18届智能系统基础国际研讨会论文集,ISMIS 09,捷克共和国布拉格,第45-55页
[26] DOI:10.1007/s10844-011-0168-1·doi:10.1007/s10844-011-0168-1
[27] Ramamohanarao,K,Bailey,J和Fan,H.2005。对比模式的高效挖掘及其在分类中的应用。2005年第三届智能传感和信息处理国际会议论文集。2005年,第39–47页。华盛顿特区:IEEE计算机学会·doi:10.1109/ICISIP.2005.1619410
[28] Sivatha Sindhu S S,《国际系统科学杂志》(2011年)
[29] 数字对象标识码:10.1007/s11390-011-0188-x·doi:10.1007/s11390-011-0188-x
[30] Terlecki,P和Walczak,K.,2008。《Top-K最小跳跃新兴模式的有效发现》,第5306卷,438–447页。柏林,海德堡:施普林格·Zbl 1185.68576号
[31] DOI:10.1016/j.tcs.2004.12.014·Zbl 1080.68042号 ·doi:10.1016/j.tcs.2004.12.014
[32] 内政部:10.1080/00207721003710649·Zbl 1260.93016号 ·doi:10.1080/0207721003710649
[33] Witten I H,《数据挖掘:实用机器学习工具和技术》,摩根-考夫曼数据管理系统系列,2。编辑(2005)
[34] 肖毅,《国际创新计算、信息与控制杂志》,第7页,3239页–(2011年)
[35] Yang Q,《国际创新计算、信息与控制杂志》,第7页,2809–(2011)
[36] Yu H H,《国际创新计算、信息与控制杂志》7 pp 5515–(2011)
[37] Zhang,X,Dong,G和Kotagiri,R.2000。探索从大型高维数据集中高效挖掘新兴模式的限制。第六届ACM SIGKDD知识发现和数据挖掘国际会议论文集,KDD'00。2000年,第310-314页。美国马萨诸塞州波士顿市纽约市:ACM
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。