×

自然CC

swMATH ID: 36364
软件作者: 姚婉、杨河、张建国、隋玉磊、海金、徐冠东、熊才明、菲利普·S·余
描述: NaturalCC:将源代码语料库自然化的工具包。我们提出了NaturalCC,这是一个高效且可扩展的工具包,用于弥补自然语言和编程语言之间的差距,并促进对大代码分析的研究。使用NaturalCC,来自自然语言或编程语言社区的研究人员可以快速轻松地复制最先进的基线并实现他们的方法。NaturalCC是在Fairseq和PyTorch的基础上构建的,它提供了(1)利用多GPU和混合精度数据处理进行高效计算的快速模型训练,(2)模块化和可扩展的框架,使其易于重现或实现大代码分析方法,以及(3)一个命令行界面和一个图形用户界面来演示每个模型的性能。目前,我们已经在不同任务(例如,代码完成、代码注释生成和代码检索)中包含了几个最先进的基线,以供演示。这个演示的视频可以在这个https URL上找到。
主页: https://xcodemind.github.io网址
源代码:  https://github.com/CGCL-codes/naturalcc
依赖项: 蟒蛇
关键词: 软件工程;arXiv_cs。东南方;自然语言;程序设计语言;自然语言处理;自然语言处理;程序设计语言分析;大代码;工具箱
相关软件: 代码BERT;VulDeePecker公司;罗贝尔塔;公平;AllenNLP公司;代码2当量;BERT(误码率);蟒蛇
引用于: 0个文档

标准文章

1出版物描述软件 年份
NaturalCC:一个使源代码语料库自然化的工具包arXiv公司
姚婉、杨河、张建国、隋玉磊、海金、徐冠东、熊才明、菲利普·S·余
2020