Word-Class Embeddings for Multiclass Text Classification

doi:10.5281/zenodo.4468313

2020年12月31日出版 |版本v1

期刊文章正常开放

用于多类文本分类的词类嵌入

1意大利国家研究委员会

预先训练的单词嵌入编码了自然语言的一般词汇语义和词汇规则，并已被证明在许多NLP任务中有用，包括词义消歧、机器翻译和情感分析等。在监督任务中，如多类文本分类（本文的重点），使用编码特定任务信息的特定嵌入来增强单词表示似乎很有吸引力。我们提出了（有监督的）词类嵌入（WCE），并表明，当连接到（无监督的）预训练词嵌入时，它们大大促进了按主题分类的多类深度学习模型的训练。我们的实证证据表明，WCE使用六种流行的神经体系结构和六种广泛使用且公开可用的数据集进行多类文本分类，在多类分类准确性方面取得了一致的改进。这种方法的另一个优点是，它在概念上简单且易于实现。我们实现WCE的代码可在以下网址公开获取：https://github.com/AlexMoreo网站/单词类嵌入。

文件夹

主.pdf

文件夹（9.8 MB）

姓名	大小	全部下载
主.pdf md5:d40104cddde510c530d3320fbc6a915e	980万	预览下载

	所有版本	此版本
意见	209	209
下载	135	135
数据量	1.4 GB	1.4 GB

用于多类文本分类的词类嵌入

创建者

描述

文件夹

主.pdf

文件夹（9.8 MB）