计算机工程与应用››2021,第57卷››发行(22): 131-138.内政部:10.3778/j.issn.1002-8331.2007-0291

网络、通信与安全 • 上一篇   下一篇

基于深度学习可视化的恶意软件家族分类

陈小寒,魏书宁,覃正泽  

  1. 1湖南师范大学 信息科学与工程学院,长沙 410006
    2国防科技大学 并行与分布处理国防科技重点实验室,长沙 410006
  • 出版日期:2021-11-15 发布日期:2021-11-16

基于深度学习可视化的恶意软件族分类

陈晓翰、魏顺宁、秦正泽  

  1. 1.湖南师范大学信息科学与工程学院,长沙410006
    2.国防科技大学并行与分布式处理国家重点实验室,长沙410006
  • 在线:2021-11-15 出版:2021-11-16

摘要:

计算机网络技术的快速发展,导致恶意软件数量不断增加。针对恶意软件家族分类问题,提出一种基于深度学习可视化的恶意软件家族分类方法。该方法采用恶意软件操作码特征图像生成的方式,将恶意软件操作码转化为可直视的灰度图像。使用递归神经网络处理操作码序列,不仅考虑了恶意软件的原始信息,还考虑了将原始代码与时序特征相关联的能力,增强分类特征的信息密度。利用SimHash公司将原始编码与递归神经网络的预测编码融合,生成特征图像。基于相同族的恶意代码图像比不同族的具有更明显相似性的现象,针对传统分类模型无法解决自动提取分类特征的问题,使用卷积神经网络对特征图像进行分类。实验部分使用10?868个样本(包含9个恶意家族)对深度学习可视化进行有效性验证,分类精度达到98.8%,且能够获得有效的、信息增强的分类特征。

关键词: 恶意软件家族, 恶意代码可视化, 递归神经网络(RNN), 卷积神经网络(美国有线电视新闻网), SimHash公司

摘要:

计算机网络技术的快速发展导致了恶意软件的数量不断增加。针对恶意软件家族分类问题,提出了一种基于深度学习可视化的恶意软件家族划分方法。在这种方法中,恶意软件操作码被转换为可以直接查看的灰色图像。通过使用递归神经网络(RNN)处理操作码序列,本文不仅考虑了恶意软件的原始信息,还考虑了将原始代码与时序特征相关联的能力,从而提高了分类特征的信息密度。然后,使用SimHash将原始代码与RNN中的预测代码进行融合,生成特征图像。最后,基于同一系列的恶意代码图像比基于不同系列的更相似。传统的分类模型无法完成分类特征的自动提取。为了解决这个问题,本文使用卷积神经网络(CNN)对特征图像进行分类。该方法已在9个家族的10868个恶意软件实例上实现和测试,分类准确率达到98.8%,能够获得有效的增强信息的分类特征。

关键词: 恶意软件家族, 恶意代码可视化, 递归神经网络(RNN), 卷积神经网络(CNN), SimHash公司