计算机工程与应用››2020,第56卷››问题(4): 92-98.内政部:10.3778/j.issn.1002-8331.1811-0056

网络、通信与安全 • 上一篇   下一篇

基于一个和一个的恶意域名检测

周康,万良,丁红卫  

  1. 1贵州大学 计算机科学与技术学院,贵阳 550025
    2贵州大学 软件与理论研究所,贵阳 550025
  • 出版日期:2020-02-15 发布日期:2020-03-06

基于AN和LSTM的恶意域名检测

周康、万亮、丁洪伟  

  1. 1.贵州大学计算机科学与技术学院,贵阳550025
    2.贵州大学计算机理论与软件研究所,贵阳550025
  • 在线:2020-02-15 出版:2020-03-06

摘要:

目前,恶意域名被广泛应用于远控木马、钓鱼欺诈等网络攻击中,传统恶意域名检测方法存在长距离依赖性问题,容易忽略上下文信息并且数据维度过大,无法高效、准确地检测恶意域名。提出了一种自编码网络(自动编码器网络,AN)降维和长短期记忆神经网络(长短期存储器网络,LSTM)检测恶意域名的深度学习方法。利用实现包含语义的词向量表示,解决了传统方法导致的数据表示稀疏及维度灾难问题。由单词2vec构建词向量作为LSTM,注意LSTM输入与输出之间的相关性进行重要度排序,获取文本整体特征,最后将局部特征与整体特征进行特征融合,使用softmax软件分类器输出分类结果。实验结果表明,该方法在恶意域名检测上具有较好的表现,比传统检测恶意域名方法具有更高的检测率和实时性。

关键词: 恶意域名检测, 长短时记忆神经网络, 单词2vec, 收件人

摘要:

目前,恶意域名广泛应用于acting-controlled木马、钓鱼欺诈等网络攻击中。传统的恶意域名检测方法存在长距离依赖问题。由于恶意域名具有较高的数据维,很容易忽略上下文信息,很难高效准确地检测到恶意域名。本文提出了一种通过自动编码器网络(AN)与长短期记忆网络(LSTM)相结合的特征约简来检测恶意域名的深度学习方法。首先,使用包含语义的实现的词向量表示,解决了传统方法导致数据表示稀疏和维数灾难的问题。通过word2vec构造单词向量作为LSTM的输入,然后通过Attention机制对LSTM输入和输出之间的相关性进行排序,获得文本的整体特征,最后将局部特征与整体特征合并,并使用softmax分类器输出分类结果。实验结果表明,该方法在恶意域名检测中具有良好的性能,与传统的恶意域名检测方法相比,具有更高的检测率和更少的检测时间。

关键词: 恶意域名检测, 长短记忆网络, 单词2vec, 注意机制