×

代码2当量

swMATH ID: 33950
软件作者: Uri Alon、Shaked Brody、Omer Levy、Eran Yahav
描述: code2seq:从代码的结构化表示生成序列。从源代码片段生成自然语言序列的能力有多种应用,例如代码摘要、文档和检索。序列到序列(seq2seq)模型采用神经机器翻译(NMT),通过将源代码视为一系列标记,在这些任务上取得了最先进的性能。我们提出了CODE2SEQ:一种利用编程语言的语法结构更好地编码源代码的替代方法。我们的模型将代码片段表示为其抽象语法树(AST)中的组合路径集,并在解码时使用注意力来选择相关路径。我们展示了我们的方法在两个任务、两种编程语言和四个数据集(最多16M个示例)中的有效性。我们的模型明显优于以前专为编程语言设计的模型以及最先进的NMT模型。我们的模型的交互式在线演示可以在这个http URL上获得。我们的代码、数据和经过训练的模型可以在这个http://URL上获取。
主页: https://code2seq.org
源代码:  https://github.com/tech-srl/code2seq
关键词: 机器学习;arXiv_cs。LG公司;arXiv_cs。公共图书馆;arXiv_状态ML;序列;自然语言;代码
相关软件: BERT(误码率);罗伯塔;蟒蛇;CoaCor公司;CRaDLe公司;CC查找器;代码搜索网;亚当;单词2vec;事件2分钟;KGPT公司;AlexNet公司;图2序列;GPT-3级;私人电话;通用条款;Tensor2传感器;SemSUM公司;Linformer公司;JGibbLDA公司
引用于: 1文件

标准条款

1出版物描述软件 年份
code2seq:从代码的结构化表示生成序列arXiv公司
乌里·阿龙(Uri Alon)、莎克·布罗迪(Shaked Brody)、奥马尔·利维(Omer Levy)、埃兰·雅哈(Eran Yahav)
2018

在1个字段中引用

1 计算机科学(68至XX)

按年份列出的引文