摘要:二进制代码相似性检测技术在不同的安全领域中有着重要的作用。针对现有的二进制代码相似性检测方法面临计算开销大且精度低、二进制函数语义信息识别不全面和评估数据集单一等问题,提出了一种基于跳跃-SBERT的二进制代码相似性检测技术。跳跃-SBERT有两个主要创新点,一是利用孪生网络构建SBERT公司网络结构,该网络结构能够在降低模型的计算开销的同时保持计算精度不变;二是引入了跳转识别机制,使跳跃-SBERT可以学习到二进制函数的图结构信息,从而更加全面地捕获二进制函数的语义信息。实验结果表明,跳跃-SBERT个函数)中的识别准确率可达96.3%,在大函数池(10 000个函数)中的识别准确率可达85.1%,SOTA(最新技术)36.13%,跳跃SBERT在大规模二进制代码相似性检测中的表现更加稳定。消融实验表明,两个主要创新点对跳跃-SBERT均有积极作用,其中,跳转识别机制的贡献最高可达9.11%。
中图分类号: