×

通过能力模型进行概念漂移检测。 (英语) Zbl 1334.68221号

摘要:检测概念的变化,例如客户对电信服务偏好的变化,对于动态环境中的预测和决策应用来说非常重要。特别是,对于基于案例的推理系统,重要的是要知道概念漂移可以在何时以及如何有效地帮助决策者在适当的时间执行更智能的维护操作。本文提出了一种新的检测基于案例推理系统中概念漂移的方法。我们引入了一个新的能力模型,通过能力的变化检测差异,而不是测量实际的案例分布。我们的基于能力的概念检测方法不需要事先了解案例分布,并对检测到的变化的可靠性提供统计保证,以及对这些变化的有意义的描述和量化。这项研究的结论是,数据分布的变化确实反映了能力。三类八组实验表明,我们的方法能够有效地检测概念漂移,并准确地突出漂移能力区域。这些结果直接有助于解决基于案例推理中概念漂移的研究,以及能力模型研究。

理学硕士:

68层37 人工智能背景下的不确定性推理
68T05型 人工智能中的学习和自适应系统
PDF格式BibTeX公司 XML格式引用
全文: 内政部

参考文献:

[1] 高杰。;范,W。;Han,J.,《关于挖掘数据流的适当假设:分析和实践》,(第七届IEEE国际数据挖掘会议论文集。第七届EEE国际数据挖掘大会论文集,奥马哈,2007年10月28日至31日),143-152
[2] 张,P。;朱,X。;Shi,Y.,分类和挖掘概念漂移数据流,(第十四届ACM SIGKDD知识发现和数据挖掘国际会议论文集。第十四届ACM SIGKDD知识发现和数据挖掘国际会议论文集,2008年8月24日至27日,美国内华达州拉斯维加斯),812-820
[3] 欧阳,Z。;周,M。;Wang,T。;Wu,Q.,使用集成分类器挖掘概念驱动和噪声数据流,(人工智能和计算智能(AICI)国际会议论文集)。《人工智能和计算智能国际会议论文集》,中国,2009年11月7-8日),360-364
[4] Widmer,G。;Kubat,M.,《在概念漂移和隐藏背景下学习》,马赫。学习。,23, 69-101 (1996)
[5] Hulten,G。;斯宾塞,L。;Domingos,P.,挖掘时变数据流,(第七届ACM SIGKDD知识发现和数据挖掘国际会议论文集。第七届ACM SIGKDD知识发现和数据挖掘国际会议论文集,2001年8月26日至29日,加利福尼亚州旧金山),97-106
[6] 科恩,L。;Avrahami,G。;最后,M。;Kandel,A.,挖掘动态数据流的信息模糊算法,应用。软计算。,8, 1283-1294 (2008)
[7] 魏春平。;Chiu,I.T.,将电信呼叫细节转化为流失预测:一种数据挖掘方法,专家系统。申请。,23, 103-112 (2002)
[8] Widmer,G。;Kubat,M.,《通过显式上下文跟踪在动态环境中进行有效学习》,(欧洲机器学习会议论文集(ECML-93)。《欧洲机器学习会议记录》(ECML-93),奥地利维也纳,1993年4月5-7日。欧洲机器学习会议记录(ECML-93)。《欧洲机器学习会议记录》(ECML-93),奥地利维也纳,1993年4月5-7日,人工智能讲义(1993),施普林格,227-243
[9] Stanley,K.O.,《与决策树委员会一起学习概念漂移》(2003),UT-AI-TR-03-302
[10] 福曼,G.,通过时间归纳转移解决概念漂移,(《第二十届国际ACM SIGIR信息检索研究与开发会议论文集》,第二十届ACM SIGIS信息检索研究和开发国际会议论文集,美国华盛顿州西雅图,2006年8月6日至11日),252-259
[11] Tsymbal,A。;Pechenizkiy,M。;坎宁安,P。;Puuronen,S.,处理概念漂移的分类器动态集成,Inf.Fusion,9,56-68(2008)
[12] Maloof,医学硕士。;Michalski,R.S.,部分实例记忆增量学习,Artif。智力。,154, 95-126 (2004) ·Zbl 1085.68641号
[13] 西北部街道。;Kim,Y.,用于大规模分类的流集合算法(SEA),(第七届ACM SIGKDD国际知识发现和数据挖掘会议论文集。第七届AC M SIGKDD国际知识发现与数据挖掘会议文献集,加利福尼亚州旧金山,2001年8月26-29日),377-382
[14] Wang,H。;范,W。;余,P.S。;Han,J.,使用集成分类器挖掘概念驱动数据流,(第九届ACM SIGKDD国际知识发现和数据挖掘会议论文集。第九届AC M SIGKDD国际知识发现与数据挖掘会议文献集,华盛顿特区,2003年8月24-27日),226-235
[15] 最后,M,非平稳数据流的在线分类,Intell。数据分析。,6, 129-147 (2002) ·Zbl 1088.68728号
[16] 萧,W.-F。;Chang,T.-M.,《基于集群的垃圾邮件过滤增量方法》,专家系统。申请。,34, 1599-1608 (2008)
[17] Klinkenberg,R.,《学习漂移概念:示例选择与示例权重》,《智能》。数据分析。,8, 281-300 (2004)
[18] 德拉尼,S.J。;坎宁安,P。;Tsymbal,A。;Coyle,L.,一种基于案例的技术,用于跟踪垃圾邮件过滤中的概念漂移,Knowl-基于系统。,187-195年(2005年)
[19] 德拉尼,S.J。;坎宁安,P.,《垃圾邮件过滤系统中基于案例的编辑分析》,(第七届欧洲案例推理会议论文集。第七届欧盟案例推理会议文献集,西班牙马德里,8月/9月(2004)),128-141
[20] 阿哈·D·W。;Kibler,D。;Albert,M.K.,基于实例的学习算法,马赫。学习。,6,37-66(1991年)
[21] 坎宁安,P。;诺兰,N。;德拉尼,S.J。;Haahr,M.,《一种基于案例的垃圾邮件过滤方法,可以跟踪概念漂移》(《ICCBR’03长寿命CBR系统研讨会论文集》,《ICCBR'03长寿命CBR系统研讨会文献集》,挪威特隆赫姆(2003年6月))
[22] Tsymbal,A.,《概念漂移问题:定义和相关工作》(2004年4月),都柏林三一学院计算机科学系:爱尔兰三一学院计算科学系,TCD-CS-2004-15
[23] Salganicoff,M.,《使用预测错误上下文切换的懒惰学习中的容忍概念和抽样转移》,Artif。智力。第11版,133-155(1997)
[24] R.Elwell。;Polikar,R.,非平稳环境中概念漂移的增量学习,IEEE Trans。神经网络。,22, 1517-1531 (2011)
[25] Richter,M.M.,引言(Lenz,M.等人,《基于案例的推理技术:从基础到应用》(1998),Springer:Springer-Hidelberg),1-15
[26] Smyth,B。;Keane,M.T.,《记住忘记:基于案例推理系统的竞争保留案例删除策略》,(《第十四届国际人工智能联合会议论文集》,第十四届人工智能国际联合会议论文,旧金山,1995年8月20日至25日,Morgan Kaufmann), 377-382
[27] 朱,J。;杨琼,记住要补充:案例库维护的能力保留案例添加政策,(第十六届国际人工智能联合会议(IJCAI)会议记录)。第十六届国际人工智能联合会议(IJCAI)会议记录,瑞典斯德哥尔摩,1999年7月31日至8月6日),234-241
[28] Smyth,B。;McKenna,E.,能力模型和维护问题,计算。智力。,17, 235-249 (2001)
[29] 马西,S。;Craw,S。;Wiratunga,N.,《知情案例库编辑的复杂性分析》(第八届欧洲会议(ECCBR)论文集)。第八届欧洲会议(ECCBR)会议记录,土耳其费希耶,2006年9月4日至7日),325-339
[30] 克劳,S。;马西,S。;Wiratunga,N.,《知情案例库维护:复杂性分析方法》(《第二十二届全国人工智能会议论文集》,第2卷)。第二十二届全国人工智能会议记录,第2卷,加拿大不列颠哥伦比亚省温哥华,2007年7月22日至26日),1618-1621
[31] 潘,R。;杨琼。;Pan,S.J.,挖掘基于案例推理的合格案例库,Artif。智力。,171, 1039-1068 (2007) ·Zbl 1168.68487号
[32] Wilson,D.C。;Leake,D.B.,《维护基于案例的推理机:维度和方向》,计算。智力。,196-213年7月17日(2001年)
[33] 卢,N。;张,G。;Lu,J.,通过能力模型检测变化,(《第十八届基于案例推理研究与开发国际会议论文集》,第十八届国际基于案例推理研发会议论文集,意大利亚历山德里亚,2010年7月19日至22日),201-212
[34] ƀlioboitö,I.,《自适应训练集形成》(2010),维尔纽斯大学:维尔纽斯学院,博士论文
[35] Kifer,D。;Ben-David,S。;Gehrke,J.,《检测数据流的变化》,(加拿大多伦多,8月31日至9月3日。加拿大多伦多,8月31日至9月3日,第三十届超大数据库国际会议记录,第30卷(2004),180-191
[36] Dasu,T。;Krishnan,S。;Venkatasubramanian,S。;Yi,K.,《检测多维数据流变化的信息理论方法》(第三十八届统计、计算科学和应用接口研讨会论文集(接口'06)。第三十八届统计、计算科学和应用接口研讨会论文集(接口'06),加利福尼亚州帕萨迪纳,2006年5月24日至27日),1-24
[37] Patist,J.P.,最优窗口变化检测,(第七届IEEE国际数据挖掘研讨会会议记录(ICDMW’07)。第七届IEEE国际数据挖掘研讨会会议记录(ICDMW'07),美国东北部奥马哈,2007年10月28-31日),557-562
[38] Bifet,A。;Gavaldá,R.,《利用自适应窗口从时变数据中学习》,第七届SIAM国际数据挖掘会议论文集(SDM'07)。第七届SIAM国际数据挖掘会议记录(SDM'07),明尼阿波利斯,明尼苏达州,美国,2007年4月26-28日),443-448
[39] 贾马,J。;梅达斯,P。;卡斯蒂略,G。;Rodrigues,P.,《利用漂移检测进行学习》,(第十七届巴西人工智能研讨会论文集,第十七届巴西人工智能研讨会论文集中,巴西马兰豪圣路易斯,2004年9月29日至10月1日),286-295·Zbl 1105.68376号
[40] Baena-García,M。;坎波-阿维拉,J。;费达尔戈,R。;Bifet,A。;加瓦尔达,R。;Morales-Bueno,R.,《早期漂移检测方法》(ECML/PKDD 2006,数据流知识发现研讨会,ECML/PDDD 2006,从数据流中发现知识研讨会,德国柏林,2006年9月18日),77-86
[41] Yasumura,Y。;北卡罗来纳州基塔尼。;Uehara,K.,通过灵敏检测快速适应不断变化的概念,(《第二十届应用智能系统工业、工程和其他应用国际会议论文集》,第二十届工业、工程及应用智能系统其他应用国际大会论文集,京都,2007年6月26-29日),855-864
[42] 李,P。;胡,X。;梁,Q。;Gao,Y.,随机集成决策树中噪声流数据的概念漂移检测,(第六届模式识别中的机器学习和数据挖掘国际会议论文集。第六届机器学习和模式识别中数据挖掘国际大会论文集,莱比锡,2009年7月23日至25日), 236-250
[43] 苏,B。;Shen,Y.D。;Xu,W.,从分类器的角度模拟概念漂移,(IEEE控制论和智能系统会议(CIS’08)。IEEE控制论和智能系统会议(2008年9月21日至24日,中国成都),1055-1060
[44] Wilcoxon,F.,通过排名方法进行的个体比较,生物。公牛。,1, 80-83 (1945)
[45] Kolmogoroff,A.,未知分布函数的置信限,Ann.Math。《统计》,第12卷,第461-463页(1941年)·Zbl 0060.30514号
[46] Smirnov,N.V.,《经验数据中随机变量的近似分布定律》,Usp。马特·诺克,10179-206(1944)·Zbl 0063.07087号
[47] 埃夫隆,B。;Tibshirani,R.J.,《Bootstrap简介》(1993),查普曼和霍尔:查普曼与霍尔纽约·Zbl 0835.62038号
[48] 西田,K。;Yamauchi,K.,《使用统计测试检测概念漂移》,(第十届发现科学国际会议论文集(DS’07)。第十届发现科学国际会议论文集(DS’07),日本仙台,2007年10月1-4日),264-269
[49] 弗伦德,Y。;Schapire,R.E.,《在线学习的决策理论推广及其在助推中的应用》,J.Compute。系统。科学。,55, 119-139 (2007) ·Zbl 0880.68103号
[50] 韦尔奇,G。;Bishop,G.,《卡尔曼滤波器简介》(1995),北卡罗来纳大学,技术报告TR-95-041
[51] Englund,C。;Verikas,A.,《胶印过程中离群值检测的混合方法》,《工程应用》。Artif公司。智力。,18, 759-768 (2005)
[52] Angiulli,F。;Zohary,R.B.-E。;Palopoli,L.,使用默认推理的异常检测,Artif。智力。,172, 1837-1872 (2008) ·Zbl 1184.68480号
[53] 德里斯,A。;美国吕克特,《自适应概念漂移检测》,统计分析。《最小数据》,2311-327(2009)
[54] 马西,S。;Craw,S。;Wiratunga,N.,什么是CBR能力?,BCS-SGAI专家更新,8,7-10(2005)
[55] Smyth,B。;McKenna,E.,案例库能力建模,(第四届基于案例推理进展欧洲研讨会论文集。第四届欧洲基于案例推理发展研讨会论文集,爱尔兰都柏林(1998年9月)),208-220
[56] McKenna,E。;Smyth,B.,能力指导案例发现,(第二十届SGES知识系统和应用人工智能国际会议论文集。第二十届SCES知识系统与应用人工智能会议论文集,英国剑桥,2001年12月10日至12日),97-108
[57] 布赖顿,H。;Mellish,C.,《基于实例学习算法的实例选择进展》,Data Min.Knowl。发现。,6, 153-172 (2002) ·兹比尔1027.68673
[58] 科勒,E。;布朗,E。;Haneuse,S.J.-P.A.,《基于模拟的统计分析中蒙特卡罗误差的评估》,《美国统计》,第63卷,第155-162页(2009年)·Zbl 1404.62150号
[59] Berry,K.J。;Mielke,P.W.,矩近似作为方差分析中F检验的替代方法,Br.J.Math。统计心理学。,36, 202-206 (1983) ·Zbl 0522.62051号
[60] Opdyke,J.D.,《在常规蒙特卡罗抽样下实现两两和多重比较功率最大化的快速置换测试》,J.Mod。申请。统计方法,227-49(2004)
[61] Mardia,K.V.,《二元分布族》(1970),格里芬:格里芬伦敦·Zbl 0223.62062号
[62] Smyth,B。;McKenna,E.,《更新基于案例推理机能力模型的高效程序》(第十一届欧洲机器学习会议论文集(ECML'00)。第十一届欧洲机器学习会议记录(ECML'00),西班牙加泰罗尼亚巴塞罗那,2000年5月31日至6月2日),357-368
[63] Gee,K.R.,《使用潜在语义索引过滤垃圾邮件》(第十八届ACM应用计算年会论文集(SAC’03)。第十八届ACM应用计算年度研讨会论文集(SAC’03),美国佛罗里达州墨尔本,2003年3月9日至12日(460-464)
此参考列表基于出版商或数字数学图书馆提供的信息。其项与zbMATH标识符进行启发式匹配,可能包含数据转换错误。在某些情况下,zbMATH Open的数据对这些数据进行了补充/增强。这试图尽可能准确地反映原始论文中列出的参考文献,而不要求完整或完全匹配。