Charagram:通过字符n-gram嵌入单词和句子

@第{Wieting2016CharagramEW条,title={Charagram:通过字符n-grams}嵌入单词和句子,author={John Wieting和Mohit Bansal以及Kevin Gimpel和Karen Livescu},日志={ArXiv},年份={2016年},体积={abs/1607.02789},url={https://api.semanticscholar.org/CorpusID:3202289}}
结果表明,Charagram嵌入优于基于特征级递归和卷积神经网络的更复杂的体系结构,在多个相似任务上实现了最新的性能。

本文中的图表

询问这篇论文
AI供电

VCWE:视觉字符增强的单词嵌入

基于卷积神经网络的三级合成汉语单词嵌入学习模型;一种具有自我注意的递归神经网络,用于将字符表示组合到单词embedDings中;以及Skip-Gram框架,直接从上下文信息中捕获非组合性。

使用子词包概括单词嵌入

一种子词级词向量生成模型,该模型将单词视为一袋袋字符n-gram,在英语单词相似性任务以及23种语言的词性标签和形态句法属性的联合预测中实现了最先进的性能,表明该模型能够捕捉单词的文本表示和嵌入之间的关系。

字符n-gram嵌入改进RNN语言模型

基于对单词嵌入构造领域的研究,提出了一种新的递归神经网络(RNN)语言模型,该模型利用字符信息,并将其与普通单词嵌入相结合。

使用子单词RNN模拟单词嵌入

MIMICK是一种合成生成OOV单词嵌入的方法,它通过在原始单词嵌入语料库的类型级别进行学习,学习从拼写到分布嵌入的函数。

用于神经语言建模预测的基于字符和子词的单词表示

本文研究了使用子词单元(字符和因子形态分解)构建神经语言建模输出表示的效果,并表明使用基于字符的嵌入增强输出词表示可以显著提高模型的性能。

cw2vec:学习嵌入笔画n-gram信息的汉语单词

经验结果表明,所提出的cw2vec方法始终优于最先进的方法,如基于单词的word2vec和GloVe、基于字符的CWE、基于组件的JWE和基于像素的GWE。

通过单词和字符级模型的迭代优化改进单词嵌入

结果表明,该方法在5个词的相似度数据集上的性能优于现有算法,并且可以成功地应用于职称规范化,这是电子招聘领域中的一个重要问题,也是OOV问题。

无分段组合n元嵌入

该方法的主要思想是完全忽略单词边界,在一个原始语料库中通过嵌入合成子n元来构建所有字符n元的表示。

基于复合n-Gram特征的句子嵌入无监督学习

这项工作提出了一个简单但有效的无监督目标来训练句子的分布式表示,在大多数基准任务上,该目标优于最先进的无监督模型,突出了生成的通用句子嵌入的健壮性。

基于双线性卷积网络的无监督单词表征学习

提出了一种新的无监督学习方法,用于学习以原始字符作为输入表示的单词嵌入,绕过了使用字典所产生的问题,该方法允许只考虑编码器而不考虑编码器-解码器结构。
...

基于字符级文本嵌入的文本分割

这项工作提出通过训练简单递归网络来预测文本中的下一个字符,直接从原始字符序列中学习文本表示,并在监督的字符级文本分割和标记任务中使用所学习的文本嵌入作为特征。

使用编辑脚本和递归神经嵌入规范化推文

这项工作提出了一种新的文本规范化模型,该模型基于从标记数据中学习编辑操作,同时通过字符级神经文本嵌入结合从未标记数据中诱导的特征,这大大降低了英语推特规范化数据集上的单词错误率。

在形式中发现功能:开放词汇词汇表示的组合字符模型

一种通过使用双向LSTM组合字符来构建单词向量表示的模型,该模型只需要每个字符类型一个向量和组合模型的一组固定参数,从而产生语言建模和部分语音标记的最新结果。

字符和单词嵌入的联合学习

针对字符歧义和非合成词问题,提出了一种基于字符增强的单词嵌入模型(CWE),并对该模型在单词相关性计算和类比推理方面的有效性进行了评估。

基于卷积神经网络的多视角句子相似度建模

这项工作提出了一个使用多种视角的句子比较模型,首先使用卷积神经网络对每个句子进行建模,该网络在多个粒度级别提取特征,并使用多种类型的池。

使用C-PHRASE模型联合优化词汇和句子任务的单词表示

C-PHRASE是一种分布式语义模型,它通过优化句法树中各个层次短语的上下文预测来学习单词表示,在各种词汇任务上,它的表现优于状态中心C-BOW模型。

词汇表征与语素表征的协同学习

本文将形态学知识作为额外的输入表示和辅助监督引入神经网络框架,并将产生语素表示,这些语素表示可以进一步用于根据稀有或未知单词的形态学结构推断其表示。

基于对称模式的单词嵌入改进单词相似度预测

一种基于对称模式(SP)的新词级向量表示法在动词上表现出色,该方法和word2vec生成的单词相似性分数的简单组合使其预测能力优于每个单独的模型。

用于文本分类的深层无序成分竞争句法方法

这项工作提出了一个简单的深度神经网络,它在情感分析和事实性问题回答任务上与此类模型竞争,在某些情况下,其性能优于此类模型,而只需花费一小部分训练时间。

特征感知神经语言模型

一种简单的神经语言模型,它只依赖字符级输入,能够仅从字符编码语义和正字法信息,并表明在许多语言上,字符输入足以进行语言建模。
...