2020年12月31日出版 |版本v1
期刊文章 正常开放

用于多类文本分类的词类嵌入

描述

预先训练的单词嵌入编码了自然语言的一般词汇语义和词汇规则,并已被证明在许多NLP任务中有用,包括词义消歧、机器翻译和情感分析等。在监督任务中,如多类文本分类(本文的重点),使用编码特定任务信息的特定嵌入来增强单词表示似乎很有吸引力。我们提出了(有监督的)词类嵌入(WCE),并表明,当连接到(无监督的)预训练词嵌入时,它们大大促进了按主题分类的多类深度学习模型的训练。我们的实证证据表明,WCE使用六种流行的神经体系结构和六种广泛使用且公开可用的数据集进行多类文本分类,在多类分类准确性方面取得了一致的改进。这种方法的另一个优点是,它在概念上简单且易于实现。我们实现WCE的代码可在以下网址公开获取:https://github.com/AlexMoreo网站/单词类嵌入。

文件夹

主.pdf

文件夹(9.8 MB)

姓名 大小 全部下载
md5:d40104cddde510c530d3320fbc6a915e
980万 预览 下载