×

关于关联规则兴趣度的选择:面向用户的描述和多准则决策辅助。 (英语) Zbl 1168.90513号

摘要:数据挖掘算法,特别是那些用于无监督学习的算法,会生成大量规则。这尤其适用于确定关联规则的先验算法家族。因此,开采领域的专家不可能维持这些规则。为了帮助完成这项任务,已经制定了许多评估规则趣味性的措施。它们可以根据给定的目标自动筛选和排序一组规则。由于这些度量可能会产生不同的结果,并且专家对什么是好的规则有不同的理解,因此我们在本文中提出了一个选择最佳规则的新方向:两步解决推荐一个或多个用户适应的兴趣度度量的问题。首先,基于有意义的经典性质,给出了兴趣度的描述。其次,将多标准决策辅助过程应用于此分析,并说明了非数据挖掘专家的用户可以通过此类方法实现的好处。

MSC公司:

90B50型 管理决策,包括多个目标
第60页 统计学在工程和工业中的应用;控制图
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部 哈尔

参考文献:

[1] Agrawal,R.和Srikant,R.,1994年。关联规则挖掘的快速算法。收录于:Bocca,J.B.,Jarke,M.,Zaniolo,C.(编辑),《第20届超大数据库会议论文集》。摩根·坎夫曼,第487-499页。;Agrawal,R.、Srikant,R.,1994年。关联规则挖掘的快速算法。收录于:Bocca,J.B.,Jarke,M.,Zaniolo,C.(编辑),《第20届超大数据库会议论文集》。摩根·坎夫曼,第487-499页。
[2] Agrawal,R.,Imielinski,T.,Swami,A.,1993年。挖掘大型数据库中项目集之间的关联规则。In:Buneman,P.,Jajodia,S.(编辑),《1993年ACM SIGMOD国际数据管理会议论文集》,华盛顿特区,第207-216页。;Agrawal,R.,Imielinski,T.,Swami,A.,1993年。挖掘大型数据库中项目集之间的关联规则。参见:Buneman,P.,Jajodia,S.(编辑),《1993年ACM SIGMOD国际数据管理会议记录》,华盛顿特区,第207-216页。
[3] 阿泽,J。;Kodratoff,Y.,《抗冲击性评估》,《联合萃取》,萃取与评估(EGC 2002),第1期,第4期,第143-154页(2002)
[4] Barthélemy,J.-P。;Legrain,A。;Lenca,P。;Vaillant,B.,应用于关联规则兴趣度度量的值关系聚合,(人工智能的建模决策。人工智能的模型决策,人工智能讲义(2006),Springer-Verlag),203-214·邮编1096.68008
[5] Bayardo,R.J.,Agrawal,R.,1999年。挖掘最有趣的规则。收录于:KDD 1999,ACM SIGKDD知识发现和数据挖掘国际会议论文集,第145-154页。;Bayardo,R.J.,Agrawal,R.,1999年。挖掘最有趣的规则。收录于:KDD 1999,ACM SIGKDD知识发现和数据挖掘国际会议论文集,第145-154页。
[6] Bertin,J.,1977年。信息的图形和跟踪图形。弗拉马利翁。;Bertin,J.,1977年。信息的图形和跟踪图形。弗拉马利翁。
[7] Bisdorff,R.,《两两模糊排名中的两极排名》,《比利时运筹学、统计学和计算机科学杂志》,37,4 9,379-387(1999)
[8] Blanchard,J.、Guillet,F.、Briand,H.、Gras,R.,2005年。用偏离平衡的概率度量来评估规则的趣味性。摘自:第十九届应用随机模型和数据分析国际研讨会,法国布雷斯特,第191-200页。;Blanchard,J.、Guillet,F.、Briand,H.、Gras,R.,2005年。用偏离平衡的概率度量来评估规则的趣味性。在:第十一届应用随机模型和数据分析国际研讨会,法国布雷斯特,第191-200页。
[9] Borgelt,C。;Kruse,R.,关联规则归纳:A先验的实施,(《第十五届计算统计会议论文集》,(2002年),Physika Verlag:Physika-Verlag,德国海德堡)·Zbl 1441.62035号
[10] Brans,J.-P.,Mareschal,B.,2002年。普罗米修·盖亚; Brans,J.-P.,Mareschal,B.,2002年。散步盖亚
[11] Brans,J.-P.,Mareschal,B.,2005年。多标准决策分析:最新调查。摘自:Figueira,J.、Greco,S.、Ehrgott,M.(编辑)、Springer——运筹学和管理科学国际系列。第章偏好顺序结构评估法; Brans,J.-P.,Mareschal,B.,2005年。多标准决策分析:最新调查。摘自:Figueira,J.、Greco,S.、Ehrgott,M.(编辑)、Springer——运筹学和管理科学国际系列。第章偏好顺序结构评估法·Zbl 1060.90002号
[12] Brans,J.-P。;芬克,P.,《偏好排序组织方法》,《管理科学》,31,6647-656(1985)·Zbl 0609.90073号
[13] Brijs,T。;Vanhoof,K。;Wets,G.,定义关联规则的兴趣,国际信息理论与应用杂志,10,4,370-376(2003)
[14] Brin,S.、Motwani,R.、Silverstein,C.,1997a。超越市场篮子:将关联规则推广到相关性。摘自:ACM SIGMOD/PODS’97联合会议,第265-276页。;Brin,S.、Motwani,R.、Silverstein,C.,1997a。超越市场篮子:将关联规则推广到相关性。参见:ACM SIGMOD/PODS’97联合会议,第265-276页。
[15] 布林,S。;Motwani,R。;Ullman,J.D。;Tsur,S.,《市场篮子数据的动态项目集计数和隐含规则》(Peckham,J.,SIGMOD 1997,美国亚利桑那州图森市ACM SIGMOD-国际数据管理会议论文集(1997),ACM出版社),255-264
[16] Chauchat,J.-H。;Risson,A.(Blasius,J.;Greenacre,M.,《类别数据的可视化》(1998),学术出版社:纽约学术出版社),37-45,第3章
[17] Church,K.W。;Hanks,P.,《词汇联想规范,词典编纂中的相互信息》,计算语言学,16,1,22-29(1990)
[18] Cohen,J.,标称量表的一致系数,教育和心理测量,20,37-46(1960)
[19] (Fayyad,U.;Piatetsky-Shapiro,G.;Smyth,P.;Uthurusamy,R.,《知识发现和数据挖掘的进展》(1996),AAAI/MIT出版社)
[20] Francisci,D.,Brisson,L.,Collard,M.,2003年。克雷特雷倍数提取:妥协艺术。尼斯大学技术代表ISRN I3S/RR-2003-11-FR。;Francisci,D.,Brisson,L.,Collard,M.,2003年。克雷特雷倍数提取:妥协艺术。尼斯大学技术代表ISRN I3S/RR-2003-11-FR。
[21] Freitas,A.,《规则趣味性度量》,《基于知识的系统期刊》,309-315(1999)
[22] 贾库马基斯,V。;Monjardet,B.,《双人协约系数》,《唐奈统计与分析》,第12、1-2、46-99页(1987年)·Zbl 0645.06001号
[23] Good,I.J.,《概率估计:现代贝叶斯方法论文》(1965年),麻省理工学院出版社:麻省理工学院出版社,马萨诸塞州剑桥·Zbl 0168.39603号
[24] Gras,R.、Ag.Almouloud,S.、Baileuil,M.、Larher,A.、Polo,M.和Ratsimba-Rajohn,H.、Totohasina,A.,1996年。《统计学的含义》,《Données探索新方法》。应用程序a la Didactique,Travaux et Thèses。La Pensée Sauvage。;Gras,R.、Ag.Almouloud,S.、Baileuil,M.、Larher,A.、Polo,M.和Ratsimba-Rajohn,H.、Totohasina,A.,1996年。《简化统计》(L'implication Statistique),《新方法探索》(Nouvelle Méthode Exploratoire de Données)。应用程序a la Didactique,Travaux et Thèses。La Pensée Sauvage餐厅。
[25] 格拉斯,R。;Kuntz,P。;服装设计师,R。;Guillet,F.,Une version entropique de l‘intensité’implication pour les corpus volumenux,Extraction des connaissances et approventissage(EGC 2001),1,1-2,69-80(2001)
[26] 格拉斯,R。;服装设计师,R。;布兰查德,J。;Briand,H。;昆茨,P。;Peter,P.,Quelques critères pour une mesure de qualitéde règles d'association–un example:l‘intensisé’implication,Revue des Nouvelles Technologies de l’Information(质量测量)(RNTI-E-1),3-31(2004)
[27] Greco,S。;Pawlak,Z。;Slowinski,R.,贝叶斯确认度量对粗糙集决策规则有用吗?,人工智能的工程应用,17,4,345-361(2004)
[28] Hajek,P。;哈维尔,I。;Chytil,M.,The哈哈自动假设确定方法,计算,1293-308(1966)·Zbl 0168.26105号
[29] Hilderman,R。;Hamilton,H.,《对发现的知识进行排序的兴趣度评估》,《计算机科学讲义》,2035247-259(2001)·Zbl 0989.68595号
[30] Hilderman,R。;Hamilton,H.,《测量发现知识的趣味性:原则方法》,《智能数据分析》,2003年第7期,第4347-382页·兹比尔1083.68570
[31] Jeffreys,H.,《概率论处理的意义测试》,《剑桥哲学学会学报》,第31期,第203-222页(1935年)
[32] Kamber,M.,Shingal,R.,1996年8月。评估特征规则的趣味性。摘自:《第二届知识发现和数据挖掘国际会议论文集》(KDD96),俄勒冈州波特兰,第263-266页。;Kamber,M.,Shingal,R.,1996年8月。评估特征规则的趣味性。摘自:《第二届知识发现和数据挖掘国际会议论文集》(KDD96),俄勒冈州波特兰,第263-266页。
[33] Klemettinen,M。;Mannila,H。;Ronkainen,P。;香薰酮,H。;Verkamo,A.I.,《从发现的大量关联规则中发现有趣的规则》,(Adam,N.R.;Bhargava,B.K.;Yesha,Y.,《第三届信息和知识管理国际会议》(CIKM’94)(1994),ACM出版社),401-407
[34] Lallich,S.,2002年。测量和验证鉴赏提取物。里昂大学2。;Lallich,S.,2002年。测量和验证鉴赏提取物。里昂第二大学的康复训练。
[35] 拉利奇,S。;Teytaud,O.,Evaluation et validation de l'intérít des règles d'association,Revue des Nouvelles Technologies de l'Information(质量测量)(RNTI-E-1),193-217(2004)
[36] Lallich,S.、Vaillant,B.、Lenca,P.,2005年5月。关联规则兴趣度评估的参数化度量。在:第十一届应用随机模型和数据分析国际研讨会,法国布雷斯特,第220-229页。;Lallich,S.、Vaillant,B.、Lenca,P.,2005年5月。关联规则兴趣度评估的参数化度量。摘自:第十九届应用随机模型和数据分析国际研讨会,法国布雷斯特,第220-229页。
[37] Lenca P.、Meyer P.、Picouet P.、Vaillant B.、Lallich S.,2003a。质量评估准则电子海图; Lenca P.、Meyer P.、Picouet P.、Vaillant B.、Lallich S.,2003a。质量评估准则电子海图
[38] Lenca,P。;梅耶,P。;维兰特,B。;Picouet,P.,Aide multicritèreála décision pourévaluer les index de qualitédes connaissances–modélisation des préférences de l’utiliateur,RSTI-RIA(EGC 2003),1,17,271-282(2003)
[39] Lenca,P。;梅耶,P。;维兰特,B。;皮库埃,P。;Lallich,S.,es valuation et analysis multicrite des mesures de qualitédes règles d'association,Revue des Nouvelles Technologies de l'Information(质量测量)(RNTI-E-1),219-246(2004)
[40] Lenca,P.、Lallich,S.、Vaillant,B.,2006年。关于关联规则的稳健性。摘自:IEEE控制论和智能系统国际会议,泰国曼谷,第596-601页。;Lenca,P.、Lallich,S.、Vaillant,B.,2006年。关于关联规则的稳健性。摘自:IEEE控制论和智能系统国际会议,泰国曼谷,第596-601页。
[41] Lerman,I.,《données的分类与分析》(1970年),Dunod
[42] 勒曼,I。;Azé,J.,《不确定概率上下文判别法》,RSTI-RIA(EGC 2003),1,17,247-262(2003)
[43] Lerman,I.,Gras,R.,Rostam,H.,1981年。阐述“非指示”的含义,请参见《多恩的双子星》第一章和第二章。数学与科学Humaines(74,75),5-35,5-47。;Lerman,I.,Gras,R.,Rostam,H.,1981年。阐述“非指示”的含义,请参见《多恩的双子星》第一章和第二章。《数学与科学》(74,75),5-35,5-47·Zbl 0493.62093号
[44] 勒索,E。;Lenca,P。;Picouet,P.,认知约束下规则库的动态适应,《欧洲运筹学杂志》,136,2,299-309(2002)·Zbl 1091.90521号
[45] Lim,T。;洛,W。;Shih,Y.,三十三种新旧分类算法的预测精度、复杂性和训练时间的比较,机器学习,40203-228(2000)·Zbl 0969.68669号
[46] Lingoes,J.,结构相似性指数,(关系数据的几何表示(1979),数学出版社),675-679
[47] Liu,B.,Hsu,W.,Chen,S.,1997年。使用一般印象分析发现的分类规则。摘自:第三届知识发现和数据挖掘国际会议,第31-36页。;Liu,B.,Hsu,W.,Chen,S.,1997年。使用一般印象分析发现的分类规则。摘自:第三届知识发现和数据挖掘国际会议,第31-36页。
[48] 刘,B。;徐伟。;陈,S。;Ma,Y.,分析关联规则的主观趣味性,IEEE智能系统,15,5,47-55(2000)
[49] Loevinger,J.,《构建和评估能力测试的系统方法》,《心理学专著》,61,4(1947)
[50] Marichal,J.-L。;梅耶,P。;Roubens,M.,《排序多属性备选方案:托马索方法,计算机与运筹学,32861-877(2005)·Zbl 1071.90550号
[51] McGarry,K.,《知识发现兴趣度调查》,《知识工程评论期刊》,20,1,39-61(2005)
[52] 北卡罗来纳州帕斯基尔。;巴斯蒂德,Y。;陶伊,R。;Lakhal,L.,发现关联规则的频繁闭项集,(Beeri,C.;Buneman,P.,《数据库理论》,第七届国际会议,数据库理论,第七次国际会议,计算机科学讲稿,第1540卷(1999),Springer),398-416
[53] Pearson,K.,《进化论的数学贡献》。III、 回归、遗传和泛混合,英国皇家学会哲学汇刊A(1896)
[54] Piatetsky-Shapiro,G.,《强规则的发现、分析和表示》(Piatetscky-Shapilo,G.;Frawley,W.,《数据库中的知识发现》(1991),AAAI/MIT出版社),229-248
[55] Rauch,J.,Simunek,M.,2001年。按4英尺分钟挖掘4英尺关联规则。摘自:《Prolog应用国际会议记录》,第285-294页。;Rauch,J.,Simunek,M.,2001年。按4英尺分钟挖掘4英尺关联规则。摘自:《Prolog应用国际会议记录》,第285-294页。
[56] Roy,B.,《决策辅助的多准则方法》(1996),Kluwer学术出版社·Zbl 0893.90108号
[57] Roy,B.,Bouyssou,D.,1993年。辅助多重决策:方法与案例。巴黎经济特区。;Roy,B.,Bouyssou,D.,1993年。辅助多重决策:方法与案例。Economica,巴黎·Zbl 0925.90230号
[58] Sebag,M.和Schoenauer,M.,1988年。从不完整和不连贯的学习基础中生成具有确定性和置信度的规则。摘自:Boose,J.,Gaines,B.,Linster,M.(编辑),Proc。欧洲知识获取研讨会(EKAW’88)。Gesellschaft für Mathematik und Datenverabeitung mbH,第28-1-28-20页。;Sebag,M.和Schoenauer,M.,1988年。从不完整和不连贯的学习基础中生成具有确定性和置信度的规则。摘自:Boose,J.,Gaines,B.,Linster,M.(编辑),Proc。欧洲知识获取研讨会(EKAW’88)。Gesellschaft für Mathematik und Datenverabeitung mbH,第28-1-28-20页。
[59] Silberschatz,A.,Tuzhilin,A.,1995年。关于知识发现中兴趣的主观测量。摘自:《知识发现和数据挖掘》,第275-281页。;Silberschatz,A.,Tuzhilin,A.,1995年。论知识发现中有趣程度的主观衡量标准。摘自:《知识发现和数据挖掘》,第275-281页。
[60] 铃木,E.,《从无监督表中发现有趣异常的数据挖掘方法》,《通用计算机科学杂志》,12,6,627-653(2006)
[61] Tan,P.,Kumar,V.,2000年。关联模式的有趣度量:一个视角。技术代表TR00-036,明尼苏达大学计算机科学系。;Tan,P.,Kumar,V.,2000年。关联模式的有趣度量:一个视角。明尼苏达大学计算机科学系技术代表TR00-036。
[62] Tan,P.-N.,Kumar,V.,Srivastava,J.,2002年。为关联模式选择正确的兴趣度度量。摘自:第八届ACM SIGKDD国际KDD会议记录,第32-41页。;Tan,P.-N.,Kumar,V.,Srivastava,J.,2002年。为关联模式选择正确的兴趣度度量。摘自:第八届ACM SIGKDD国际KDD会议记录,第32-41页。
[63] Vaillant,B.、Picouet,P.、Lenca,P.和Mai,2003年。用于规则质量度量基准测试的可扩展平台。摘自:Bisdorff,R.(编辑),《以人为本的过程》(HCP’2003),卢森堡,第187-191页。;Vaillant,B.、Picouet,P.、Lenca,P.和Mai,2003年。用于规则质量度量基准测试的可扩展平台。摘自:Bisdorff,R.(编辑),《以人为本的过程》(HCP’2003),卢森堡,第187-191页。
[64] 维兰特,B。;Lenca,P。;Lallich,S.,兴趣度测量的聚类,(《人工智能讲义》,第3245卷(2004年),Springer出版社),290-297·Zbl 1110.68474号
[65] Zhang,T.,协会规则,(Terano,T.;Liu,H.;Chen,A。L.P.,《知识发现和数据挖掘,当前问题和新应用》,第四届亚太会议,PADKK 2000,日本京都,会议记录。知识发现和数据挖掘,当前问题和新应用,第四届亚太会议,PADKK 2000,日本京都,计算机科学论文集,第1805卷(2000),Springer)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。