×

进口2vec

swMATH编号: 28301
软件作者: 巴特·泰滕、弗雷德里克·范德普特、汤姆·范·库特森
描述: Import2vec-学习软件库的嵌入。我们考虑为捕获库之间语义相似性的库包开发合适的学习表示(嵌入)的问题。众所周知,这种表示可以提高下游学习任务(例如分类)或应用程序(例如上下文搜索和类比推理)的性能。我们应用自然语言处理(NLP)中的单词嵌入技术来训练库包的嵌入(“库向量”)。库向量通过与源代码中的导入语句所确定的使用上下文相似的上下文来表示库。在三个大型开源软件语料库上训练这种嵌入的实验结果表明,库向量捕获了软件库之间语义上有意义的关系,例如框架及其插件和库之间的关系,这些插件和库通常在生态系统中一起使用,例如大数据基础设施项目(Java)、前端和后端web开发框架(JavaScript)以及数据科学工具包(Python)。
主页: https://arxiv.org/abs/1904.03990
关键词: arXiv_cs。东南方;信息检索;arXiv_cs。红外;arXiv_cs。LG公司;机器学习;arXiv_状态ML
相关软件: 像素x像素;CycleGAN公司;PyTorch公司;github
引用于: 0个文档

标准文章

1出版物描述软件 年份
Import2vec-学习软件库的嵌入arXiv公司
巴特·泰滕、弗雷德里克·范德普特、汤姆·范·库特森
2019