×

私人电话

swMATH ID: 37756
软件作者: 简唐、孟曲、乔竹梅
描述: PTE:通过大规模异构文本网络嵌入预测文本。无监督文本嵌入方法,如Skip-gram和Paragraph Vector,由于其简单性、可扩展性和有效性,已经引起了越来越多的关注。然而,与复杂的深度学习体系结构(如卷积神经网络)相比,这些方法在应用于特定的机器学习任务时通常会产生较差的结果。一个可能的原因是,这些文本嵌入方法以完全无监督的方式学习文本的表示,而不利用任务可用的标记信息。尽管所学习的低维表示适用于许多不同的任务,但它们并没有特别针对任何任务进行调整。本文通过提出一种文本数据的半监督表示学习方法来填补这一空白,我们称之为extit{预测文本嵌入}(PTE)。预测性文本嵌入利用标记和未标记数据来学习文本嵌入。首先将标记信息和不同层次的词共现信息表示为一个大规模的异构文本网络,然后通过一种原理性的高效算法将其嵌入到一个低维空间中。这种低维嵌入不仅保留了单词和文档的语义贴近性,而且对特定任务具有很强的预测能力。与最近基于卷积神经网络的监督方法相比,预测文本嵌入具有可比性或更有效、效率更高、需要调整的参数更少。
主页: https://arxiv.org/abs/1508.00200
源代码:  https://github.com/mnqu/PTE
关键词: arXiv_cs。机器学习arXiv_cs。LG公司神经和进化计算arXiv_cs。
相关软件: 单词2vec节点2vecDeepWalk公司线路metatah2vect-SNE公司PyTorch公司HIN2Vec公司大VisNetSMF公司UMAP公司AlexNet公司张紧器2传感器伯特手套DGL公司ImageNet公司OHSUMED公司RCV1型GraRep公司
引用于: 8文件

按年份列出的引文