×

一种新的约束类关联规则挖掘方法。 (英语) Zbl 1390.68549号

摘要:为了使用关联分类算法创建分类器,需要从训练数据集中获取一组完整的类关联规则(CAR)。然而,大多数生成的规则要么是多余的,要么是微不足道的。它们不仅会在决策过程中混淆最终用户,还会降低分类过程的性能。因此,在使用之前,有必要尽可能地消除冗余或不重要的规则。一个相关的问题是发现有趣或有用的规则。在现有的分类系统中,这组规则可能不容易发现。然而,在实际应用程序中,最终用户通常会考虑包含特定类之一的规则。例如,在癌症筛查应用中,研究人员对将基因分类为“癌症”类别的规则非常感兴趣。本文提出了一种新的挖掘相关CAR的方法,该方法考虑了对规则结果的约束。设计了一种用于存储数据集中频繁项集的树结构。然后,给出并证明了一些不能生成满足类约束的规则的树节点剪枝定理。最后,提出了一种挖掘约束CAR的有效算法。实验表明,该方法比现有方法速度更快。

MSC公司:

68T05型 人工智能中的学习和自适应系统
62H30型 分类和区分;聚类分析(统计方面)
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] Abdelhamid,内达;阿拉丁·艾伊什;Fadi Thabtah;萨马德·艾哈迈迪;Hadi,Wael,MAC:一种多类关联分类算法,J.Inf.Knowl。管理。,11, 02, 1-10 (2012)
[2] 内达·阿卜杜勒哈米德;Fadi Thabtah;Aladdin Ayesh,《联合分类方法:回顾与比较》,J.Inf.Knowl。管理。,13, 3, 1-30 (2014)
[5] 埃琳娜·巴拉利斯;卢卡·卡利略(Luca Cagliero);塔妮娅·塞奎泰利(Tania Cerquitelli);Garza,Paolo,带约束的广义关联规则挖掘,Inf.Sci。,194, 68-84 (2012)
[6] 卢卡·卡利略(Luca Cagliero);Garza,Paolo,用分类信息改进分类模型,Data Knowl。工程,86,85-101(2013)·Zbl 1355.68225号
[7] 卢卡·卡利略(Luca Cagliero);Garza,Paolo,基于基数约束的项目集泛化,信息科学。,224, 161-174 (2013) ·Zbl 1355.68225号
[8] 蔡瑞初;Anthony Tung;张振杰;郝志峰,平等者之间的不平等是什么?根据基因表达数据排列等效规则,IEEE Trans。知识。数据工程,23,11,1735-1747(2011)
[9] 陈春浩;蒋瑞东;Lee,Cho Ming;Chen,Chih-Yang,通过规则优先级提高关联分类器的性能,Knowl-基于系统。,36, 59-67 (2012)
[10] 陈,Fuzan;王燕兰;李敏强;吴,哈里斯;Tian,Jin,主关联挖掘:一种有效的分类方法,Knowl-基于系统。,67, 16-25 (2014)
[11] 邓厚涛;乔治·伦格(George Runger);Tuv,尤金;Bannister,Wade,CBC:具有少量规则的关联分类器,12月补充系统。,59, 163-170 (2014)
[12] 董洁;Han,Min,BitTableFI:一种高效的频繁项集挖掘算法,Knowl-基于系统。,20, 4, 329-335 (2007)
[13] Duong,Hai;田庄;Le,Bac,《知识工程中使用单约束高级计算方法挖掘频繁项集的高效算法》(2013),Springer,第367-378页
[15] 埃尔南德斯·莱昂(Hernández-Leon),劳代尔(Raudel);何塞·埃尔南德斯·帕兰卡;Carrasco-Ochoa,J.A。;Martínez-Trinida,JoséFco,《研究关联分类模式识别的混合规则排序策略中的Netconf》(2014),Springer,第51-60页
[16] 洪子培;王庆耀,一种高效的关联规则维护算法,用于记录修改,实验系统。申请。,37, 1, 618-626 (2010)
[17] 洪子培;王庆耀;Tseng,Shian-Shyong,使用预大型序列维护序列模式的增量挖掘算法,实验系统。申请。,387051-7058(2011年)
[18] 梁凯生;Lakshmanan,Laks V.S。;Ng,Raymond T.,使用FP-树开发简洁约束,ACM SIGKDD Explor。纽斯利特。,4, 1, 40-49 (2002)
[22] 林文阳;黄国伟;Wu,Chin-Ang,MCFPTree:一种基于FP树的多约束模式发现算法,国际期刊Bus。智力。最小数据,5,3231-246(2010)
[24] 刘华文;刘磊;张慧杰,一种使用Galois连接的快速剪枝冗余规则方法,应用。软计算。,11, 1, 130-137 (2011)
[28] 阮、当;Vo,海湾;Le,Bac,并行挖掘类关联规则的有效策略,实验系统。申请。,第41页,第10页,第4716-4729页(2014年)
[29] Nguyen,Loan T.T。;Vo,海湾;洪子培;Thanh,Hoang Chi,基于关联规则的分类:基于格的方法,实验系统。申请。,39, 13, 11357-11366 (2012)
[30] Nguyen,Loan T.T。;Vo,海湾;洪子培;Thanh,Hoang Chi,CAR-Miner:挖掘类关联规则的有效算法,实验系统。申请。,40, 6, 2305-2311 (2013)
[32] 宋伟;杨炳如;Xu,Zhangyan,Index-BitTableFI:挖掘频繁项集的改进算法,Knowl-基于系统。,21, 6, 507-513 (2008)
[38] Vo,海湾;洪子培;Le,Bac,DBV-Miner:用于快速挖掘频繁闭合项集的动态位向量方法,Exp.Syst。申请。,39, 8, 7196-7206 (2012)
[39] Vo,海湾;Le,Bac,《基于关联规则挖掘的新型分类算法——知识获取:方法、算法和应用》,第5465卷(2009年),Springer
[40] Vo,海湾;Le,Tuong;洪宗培;Le,Bac,增量挖掘中维护预大基频项集格的有效方法,应用。智力。,41, 3, 759-775 (2014)
[42] 穆罕默德·扎基;肖长杰,挖掘闭项集及其格结构的高效算法,IEEE Trans。知识。数据工程,17,4,462-478(2005)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。