代码2seq swMATH ID: 33950 软件作者: 乌里·阿龙(Uri Alon)、莎克·布罗迪(Shaked Brody)、奥马尔·利维(Omer Levy)、埃兰·雅哈(Eran Yahav) 描述: code2seq:从代码的结构化表示生成序列。从源代码片段生成自然语言序列的能力有多种应用,例如代码摘要、文档和检索。序列到序列(seq2seq)模型采用神经机器翻译(NMT),通过将源代码视为一系列标记,在这些任务上取得了最先进的性能。我们提出了CODE2SEQ:一种利用编程语言的语法结构更好地编码源代码的替代方法。我们的模型将代码片段表示为其抽象语法树(AST)中的组合路径集,并在解码时使用注意力来选择相关路径。我们展示了我们的方法在两个任务、两种编程语言和四个数据集(最多16M个示例)中的有效性。我们的模型明显优于以前专为编程语言设计的模型以及最先进的NMT模型。我们的模型的交互式在线演示可以在这个http URL上获得。我们的代码、数据和经过训练的模型都可以在这个http URL上找到。 主页: 网址:https://code2seq.org 源代码: https://github.com/tech-srl/code2seq 关键词: 机器学习;arXiv_cs。LG公司;arXiv_cs。损益;arXiv_状态。毫升;序列;自然语言;代码 相关软件: BERT(误码率);罗伯塔;蟒蛇;CoaCor公司;CRaDLe公司;CCFinder(CCFinder);代码搜索网;亚当;通用条款;图形IE;美国海军陆战队;PyTorch公司;GLoMo公司;DIG公司;数字网络;私人电话;GloVe公司;文本排名;DGL公司;ImageNet公司 引用于: 1文件 标准条款 1出版物描述软件 年份 code2seq:从代码的结构化表示生成序列arXiv公司乌里·阿龙(Uri Alon)、莎克·布罗迪(Shaked Brody)、奥马尔·利维(Omer Levy)、埃兰·雅哈(Eran Yahav) 2018 全部的 前5名7位作者引用 1 高汉宁 1 郭晓杰 1 李树成 1 朗,波 1 裴健 1 沈凯 1 吴凌飞 连载1篇 1 机器学习的基础和趋势 在1个字段中引用 1 计算机科学(68至XX) 按年份列出的引文