×

PyMT5型

swMATH ID: 40112
软件作者: Colin B.Clement、Dawn Drain、Jonathan Timcheck、Alexey Svyatkovskiy、Neel Sundaresan
描述: PyMT5:使用转换器对自然语言和Python代码进行多模式翻译。同时建模源代码和自然语言在自动化软件开发和理解中有许多令人兴奋的应用。为了实现这种技术,我们引入了PyMT5,Python方法的文本到文本转换转换器,它被训练为在所有Python-方法特征组合对之间进行转换:一个可以从自然语言文档字符串(docstring)预测整个方法的单一模型并将代码汇总为任何常见样式的文档字符串。我们对2600万个Python方法和770万个方法-文档串对的大规模并行语料库进行了分析和建模,表明在文档串和方法生成方面,PyMT5优于英语预训练或随机初始化的类似大小的自回归语言模型(GPT2)。在CodeSearchNet测试集上,我们的最佳模型预测为92.1
主页: https://arxiv.org/abs/2010.03150
依赖项: 蟒蛇
关键词: 机器学习;arXiv_cs。LG公司;软件工程;arXiv_cs。东南方;PyMT5型;多模式转换;自然语言;Python代码;变压器
相关软件: 代码搜索网;BERT(误码率);代码BERT;代码XGLUE;设计;图形代码BERT;MISIM公司;StaQC公司;CoCoSUM公司;Bugram(错误);胶水;皮提亚;代码BLEU;小队;深臭虫;BLEU公司;自由演讲;芳香;罗伯塔;XGLUE公司
引用于: 0个文档