代码2vec swMATH ID: 32380 软件作者: 乌里·阿隆、梅塔尔·齐尔伯斯坦、奥马尔·利维、埃兰·雅哈夫 说明: code2vec:学习代码的分布式表示。我们提出了一种将代码片段表示为连续分布向量的神经模型(“代码嵌入”)。其主要思想是将代码段表示为单个固定长度的代码向量,可用于预测代码段的语义属性。这是通过将代码分解为其抽象语法树中的一组路径来实现的,并在学习如何聚合一组路径的同时学习每个路径的原子表示。我们通过使用它从方法体的向量表示中预测方法的名称来证明我们的方法的有效性。我们通过在14M方法的数据集上训练模型来评估我们的方法。我们表明,在此数据集上训练的代码向量可以从训练期间完全未观察到的文件中预测方法名。此外,我们还表明,我们的模型学习了有用的方法名称向量,这些向量可以捕获语义相似性、组合和类比。在相同的数据集上比较以前的技术,我们的方法获得了75以上的相对改进 主页: https://arxiv.org/abs/1803.09473 源代码: https://github.com/tech-srl/code2vec 相关软件: 亚当;单词2vec;设计;代码BERT;图RNN;PyTorch公司;图形代码BERT;MISIM公司;StaQC公司;CoCoSUM公司;Bugram(错误);胶水;皮提亚;代码BLEU;小队;深度Bugs;布鲁;自由演讲;芳香;罗伯塔 引用于: 3文件 全部的 前5名10位作者引用 1 阿卜杜拉赫曼·阿拉赫马迪 1 艾哈迈德·阿拉赫马蒂。 1 拉格汉德拉·拉奥(Raghavendra Rao Althar) 1 穆罕默德·祖拜尔·汗 1 伊雷娜·科普林斯卡 1 李明 1 马一凡 1 本杰明·巴恩 1 黛布拉塔·萨曼塔 1 卡琳娜·亚塞夫 2篇连载文章中引用 2 机器学习 1 数学生物科学与工程 在1个字段中引用 三 计算机科学(68至XX) 按年份列出的引文