计算机科学››2012,第39卷››问题(1): 152-155.

数据库与数据挖掘 • 上一篇   下一篇

一种基于混合集成方法的数据流概念漂移检测方法

桂林 张玉红 胡学钢  

  1. (合肥工业大学计算机与信息学院 合肥230009)
  • 出版日期:2018-11-16 发布日期:2018-11-16

基于混合集成方法的数据流概念漂移检测方法

  • 在线:2018-11-16 出版:2018-11-16

摘要:近年来,数据流分类问题研究受到了普遍关注,而漂移检测是其中一个重要的研究问题。已有的分类模型有单一集成模型和混合模型,其漂移检测机制多基于理想的分布假设。单一模型集成可能导致分类误差扩大,噪音环境下分类效果受到了一定影响,而混合集成模型多存在分类精度和时间性能难以两者兼顾的问题。为此,基于简单的我们集成框架,构建了基于决策树和贝叶斯混合模型的集成分类方法WE-DTB、并利用典型的概念漂移检测机制Hoeffing界限和μ检验来进行数据流环境下概念漂移的检测和分类。大量实验表明,WE-DTB公司能够有效检测概念漂移且具有较好的分类精度及时空性能。

关键词: 数据流,概念漂移,分类,噪音

摘要:数据流概念漂移挖掘是数据挖掘中的一个热点问题。现有的分类方法包括基于单基分类器的集成方法和基于混合基分类器的集合方法,这两种方法都依赖于平稳性假设和可识别性假设。然而,前者可能会导致较大的分类偏差,并且在噪声数据流中精度性能受到影响,而后者在分类精度或时间消耗方面表现较差。受此启发,提出了一种基于决策树和朴素贝叶斯混合模型的集成分类方法WE-DTB。它是WE模型的扩展框架。同时,我们利用流行的基于Hocffding边界和μ测试的概念漂移检测机制来实现对概念漂移的检测。大量实验表明,我们提出的方法WE-DTB能够有效地检测概念漂移,同时保持了良好的分类精度和时间和空间消耗性能。

关键词: 数据流、概念漂移、分类、噪声

[1] 李燕,张玉红,胡学钢.
基于C4.5和NB混合模型的数据流分类算法
基于C4混合模型的数据流分类算法。5和NB
计算机科学, 2010, 37(12): 138-142.
已查看
全文


摘要

引用

  共享   
  讨论   
找不到建议阅读的文章!