×

代码2seq

swMATH ID: 33950
软件作者: 乌里·阿龙(Uri Alon)、莎克·布罗迪(Shaked Brody)、奥马尔·利维(Omer Levy)、埃兰·雅哈(Eran Yahav)
描述: code2seq:从代码的结构化表示生成序列。从源代码片段生成自然语言序列的能力有多种应用,例如代码摘要、文档和检索。序列到序列(seq2seq)模型采用神经机器翻译(NMT),通过将源代码视为一系列标记,在这些任务上取得了最先进的性能。我们提出了CODE2SEQ:一种利用编程语言的语法结构更好地编码源代码的替代方法。我们的模型将代码片段表示为其抽象语法树(AST)中的组合路径集,并在解码时使用注意力来选择相关路径。我们展示了我们的方法在两个任务、两种编程语言和四个数据集(最多16M个示例)中的有效性。我们的模型明显优于以前专为编程语言设计的模型以及最先进的NMT模型。我们的模型的交互式在线演示可以在这个http URL上获得。我们的代码、数据和经过训练的模型都可以在这个http URL上找到。
主页: https://code2seq.org
源代码: https://github.com/tech-srl/code2seq
关键词: 机器学习;arXiv_cs.LG公司;arXiv_cs.PL公司;arXiv_状态ML;序列;自然语言;代码
相关软件: 蟒蛇;代码BERT;VulDeePecker公司;罗伯塔;费尔塞克;AllenNLP公司;BERT(误码率);自然CC;摩西;OpenNMT(OpenNMT);SABER公司;PQL公司;DynaMine公司;自由基;雅高;DBpedia(数据库);github;图4代码
引用于: 0出版物

标准条款

1出版物描述软件 年份
code2seq:从代码的结构化表示生成序列
乌里·阿龙(Uri Alon)、莎克·布罗迪(Shaked Brody)、奥马尔·利维(Omer Levy)、埃兰·雅哈(Eran Yahav)
2018