垃圾邮件分类的拟议集成模型的开发

作者

  • Akhilesh Kumar Shrivas公司 恰蒂斯加尔邦比拉斯普尔的Ghasidas Vishwavidyalaya大师
  • 阿米特·库马尔·德万根 恰蒂斯加尔邦Bilaspur C.V.Raman大学博士
  • S M Ghosh先生 恰蒂斯加尔邦Bilaspur C.V.Raman大学博士
  • 德文德拉·辛格

内政部:

https://doi.org/10.5755/j01.itc.50.3.27349

关键词:

集成模型(E-Model)、分类、交叉验证、垃圾邮件、文本挖掘

摘要

垃圾邮件文档分类对于电子邮件用户,尤其是非IT用户来说是一项非常具有挑战性的任务。数十亿人使用互联网,面临垃圾邮件问题。垃圾邮件的自动识别和分类有助于减少电子邮件用户管理大量电子邮件的问题。这项工作旨在通过使用数据挖掘技术构建一个用于垃圾邮件文档分类的健壮模型,做出重大贡献。在本文中,我们使用Enorn1数据集,该数据集由从Kaggle存储库中收集的垃圾邮件和火腿文档组成。我们提出了一个集成模型-1,它是多层感知器(MLP)、朴素贝叶斯和随机森林(RF)的集成,以获得更好的垃圾邮件和hame-mail文档分类准确性。实验结果表明,提出的集成模型1在分类精度方面优于其他现有分类器以及其他提出的集成模式。建议和提议的Ensemble Model-1对垃圾邮件文档的分类准确率高达97.25%。

 

下载

出版

2021-09-24

问题

章节

文章