私人电话 swMATH ID: 37756 软件作者: 简唐、孟曲、乔竹梅 描述: PTE:通过大规模异构文本网络嵌入预测文本。无监督文本嵌入方法,如Skip-gram和Paragraph Vector,由于其简单性、可扩展性和有效性,已经引起了越来越多的关注。然而,与复杂的深度学习体系结构(如卷积神经网络)相比,这些方法在应用于特定的机器学习任务时通常会产生较差的结果。一个可能的原因是,这些文本嵌入方法以完全无监督的方式学习文本的表示,而不利用任务可用的标记信息。尽管所学习的低维表示适用于许多不同的任务,但它们并没有特别针对任何任务进行调整。本文通过提出一种文本数据的半监督表示学习方法来填补这一空白,我们称之为extit{预测文本嵌入}(PTE)。预测性文本嵌入利用标记和未标记数据来学习文本嵌入。首先将标记信息和不同层次的词共现信息表示为一个大规模的异构文本网络,然后通过一种原理性的高效算法将其嵌入到一个低维空间中。这种低维嵌入不仅保留了单词和文档的语义贴近性,而且对特定任务具有很强的预测能力。与最近基于卷积神经网络的监督方法相比,预测文本嵌入具有可比性或更有效、效率更高、需要调整的参数更少。 主页: https://arxiv.org/abs/1508.00200 源代码: https://github.com/mnqu/PTE 关键词: arXiv_cs。氯;机器学习;arXiv_cs。LG公司;神经和进化计算;arXiv_cs。氖 相关软件: 单词2vec;节点2vec;DeepWalk公司;线路;metatah2vec;t-SNE公司;PyTorch公司;HIN2Vec公司;大Vis;NetSMF公司;UMAP公司;AlexNet公司;张紧器2传感器;伯特;手套;DGL公司;ImageNet公司;OHSUMED公司;RCV1型;GraRep公司 引用于: 8文件 全部的 前5名31位作者引用 2 纳达·拉夫拉奇 2 Škrlj,布拉泽 1 安德里亚·埃苏利 1 高汉宁 1 郭晓杰 1 韩嘉伟 1 侯明良 1 马丁·朱卢姆 1 塞卡里亚斯·凯法托 1 孔祥杰 1 简·克拉杰 1 李浩然 1 李书成 1 安德斯·罗兰 1 朗,波 1 阿尔贝托·蒙雷索 1 亚历杭德罗·莫雷奥 1 裴健 1 任静 1 Robnik-Šikonja,马尔科 1 法布里西奥·塞巴斯蒂亚尼 1 纳斯鲁拉·谢赫 1 沈凯 1 宋阳秋 1 Tjötheim,Dag B。 1 王晨光 1 吴凌飞 1 夏,冯 1 张达 1 张冬雨 1 张明 全部的 前5名6篇连载文章中引用 2 机器学习 2 数据挖掘与知识发现 1 计算 1 统计科学 1 机器学习的基础和趋势 1 计算机科学评论 在5个字段中引用 7 计算机科学(68至XX) 三 统计学(62-XX) 2 组合数学(05-XX) 1 博弈论、经济学、金融学以及其他社会和行为科学(91-XX) 1 生物学和其他自然科学(92-XX) 按年份列出的引文