×

DGMS公司

swMATH ID: 40110
软件作者: 项玲、吴凌飞、王赛卓、潘高宁、马腾飞、徐方丽、刘亚历克斯、吴春明、季寿玲
描述: GraphCodeBERT,DGMS:语义代码检索的深度图匹配和搜索。代码检索是从大量源代码库中查找与自然语言描述查询高度匹配的代码片段。最近的工作主要使用自然语言处理技术来处理查询文本(即人类自然语言)和代码片段(即机器编程语言),但忽略了查询文本和源代码的深层结构特征,这两者都包含丰富的语义信息。本文提出了一种基于图神经网络的端到端深度图匹配与搜索(DGMS)模型,用于语义代码检索。为此,我们首先用统一的图结构数据表示自然语言查询文本和编程语言代码片段,然后使用所提出的图匹配和搜索模型检索最佳匹配的代码片段。特别是,DGMS不仅可以捕获单个查询文本或代码片段的更多结构信息,还可以通过基于交叉注意的语义匹配操作学习它们之间的细粒度相似性。我们使用两种具有代表性的编程语言(即Java和Python)在两个公共代码检索数据集上评估了所提出的DGMS模型。实验结果表明,DGMS在两个数据集上都显著优于最先进的基线模型。此外,我们广泛的消融研究系统地调查和说明了DGMS各部分的影响。
主页: https://arxiv.org/abs/2010.12908
源代码:  https://github.com/kleincup/DGMS
关键词: 多媒体和多模式检索自然语言处理神经网络深度图匹配与搜索DGMS公司图形代码BERT
相关软件: githubPyMT5型毒性水蟒熊猫变压器PyTorch公司SemFix公司刮擦BERT(误码率)UCI-毫升果汁PyPI公司迪蒂尔伯特代码XGLUE代码BERT代码搜索网蟒蛇PyTorrent公司
引用于: 0个文档