DGMS公司 swMATH ID: 40110 软件作者: 项玲、吴凌飞、王赛卓、潘高宁、马腾飞、徐方丽、刘亚历克斯、吴春明、季寿玲 描述: GraphCodeBERT,DGMS:语义代码检索的深度图匹配和搜索。代码检索是从大量源代码库中查找与自然语言描述查询高度匹配的代码片段。最近的工作主要使用自然语言处理技术来处理查询文本(即人类自然语言)和代码片段(即机器编程语言),但忽略了查询文本和源代码的深层结构特征,这两者都包含丰富的语义信息。本文提出了一种基于图神经网络的端到端深度图匹配与搜索(DGMS)模型,用于语义代码检索。为此,我们首先用统一的图结构数据表示自然语言查询文本和编程语言代码片段,然后使用所提出的图匹配和搜索模型检索最佳匹配的代码片段。特别是,DGMS不仅可以捕获单个查询文本或代码片段的更多结构信息,还可以通过基于交叉注意的语义匹配操作学习它们之间的细粒度相似性。我们使用两种具有代表性的编程语言(即Java和Python)在两个公共代码检索数据集上评估了所提出的DGMS模型。实验结果表明,DGMS在两个数据集上都显著优于最先进的基线模型。此外,我们广泛的消融研究系统地调查和说明了DGMS各部分的影响。 主页: https://arxiv.org/abs/2010.12908 源代码: https://github.com/kleincup/DGMS 关键词: 多媒体和多模式检索;自然语言处理;神经网络;深度图匹配与搜索;DGMS公司;图形代码BERT 相关软件: github;PyMT5型;毒性;水蟒;熊猫;变压器;PyTorch公司;SemFix公司;刮擦;BERT(误码率);UCI-毫升;果汁;PyPI公司;迪蒂尔伯特;代码XGLUE;代码BERT;代码搜索网;蟒蛇;PyTorrent公司 引用于: 0个文档