撕碎

BitShred:用于可伸缩分类和语义分析的特征哈希恶意软件。每天新发现的恶意软件数量正以指数级的速度增长。这种增长已经产生了对自动恶意软件分类技术的需求,这些技术可以确定哪些恶意软件是相似的,哪些恶意软件是独特的,以及为什么。在本文中,我们提出了BitShred,一个用于大规模恶意软件相似性分析和聚类的系统,并用于自动发现簇内的语义族间和族内关系。BitShred背后的关键思想是使用特征哈希来显著减少恶意软件分析中常见的高维特征空间。特征散列还允许我们挖掘恶意软件家族和样本之间的相关特征使用共同聚类技术。我们的评估显示,BitShred将典型恶意软件分类任务的速度提高了2365倍,在单个CPU上使用的内存减少了82倍,所有这些都与以前的方法相当。我们还开发了BitShred的并行化版本,并在Hadoop框架内演示了可伸缩性。