内政部：10.18653/v1/D16-1157
语料库ID:3202289

Charagram：通过字符n-gram嵌入单词和句子

@第{Wieting2016CharagramEW条，title={Charagram：通过字符n-grams}嵌入单词和句子，author={John Wieting和Mohit Bansal以及Kevin Gimpel和Karen Livescu}，日志={ArXiv}，年份={2016年}，体积={abs/1607.02789}，url={https://api.semanticscholar.org/CorpusID:3202289}}

J.威廷莫希特·班萨尔凯伦·利维斯库
出版在里面经验…会议… 2016年7月1日
计算机科学

结果表明，Charagram嵌入优于基于特征级递归和卷积神经网络的更复杂的体系结构，在多个相似任务上实现了最新的性能。

[PDF]语义阅读器

184条引文

极具影响力的引文

13

92

68

7

本文中的图表

话题

查拉格姆单词平均值句子句子相似性单词相似性字符N-grams 相似性任务低维嵌入部分语音标记

询问这篇论文
贝塔
AI供电

我们的系统试图限制本文中找到的信息。结果质量可能有所不同。了解更多信息关于我们如何产生这些答案。

反馈？

VCWE：视觉字符增强的单词嵌入

Chi Sun公司邱喜鹏黄宣景

计算机科学

美国…协会北美分会…

2019

基于卷积神经网络的三级合成汉语单词嵌入学习模型；一种具有自我注意的递归神经网络，用于将字符表示组合到单词embedDings中；以及Skip-Gram框架，直接从上下文信息中捕获非组合性。

17

[PDF]（PDF格式）

使用子词包概括单词嵌入

赵金曼西德哈特·穆加尔梁英玉

计算机科学

自然…实证方法会议…

2018

一种子词级词向量生成模型，该模型将单词视为一袋袋字符n-gram，在英语单词相似性任务以及23种语言的词性标签和形态句法属性的联合预测中实现了最先进的性能，表明该模型能够捕捉单词的文本表示和嵌入之间的关系。

44

[PDF]（PDF格式）

字符n-gram嵌入改进RNN语言模型

Sho Takase公司铃木骏M.长田

计算机科学、语言学

AAAI人工智能会议

2019

基于对单词嵌入构造领域的研究，提出了一种新的递归神经网络（RNN）语言模型，该模型利用字符信息，并将其与普通单词嵌入相结合。

[PDF]（PDF格式）

使用子单词RNN模拟单词嵌入

尤瓦尔·平特罗伯特·古思里雅各布·艾森斯坦

计算机科学

自然…实证方法会议…

2017

MIMICK是一种合成生成OOV单词嵌入的方法，它通过在原始单词嵌入语料库的类型级别进行学习，学习从拼写到分布嵌入的函数。

147

[PDF]（PDF格式）

用于神经语言建模预测的基于字符和子词的单词表示

马蒂厄·拉博A.阿劳赞

计算机科学、语言学

SWCN@EMNLP

2017

本文研究了使用子词单元（字符和因子形态分解）构建神经语言建模输出表示的效果，并表明使用基于字符的嵌入增强输出词表示可以显著提高模型的性能。

cw2vec：学习嵌入笔画n-gram信息的汉语单词

曹少生魏璐周军（音）李小龙

计算机科学

AAAI人工智能会议

2018

经验结果表明，所提出的cw2vec方法始终优于最先进的方法，如基于单词的word2vec和GloVe、基于字符的CWE、基于组件的JWE和基于像素的GWE。

通过单词和字符级模型的迭代优化改进单词嵌入

Phong Ha公司Shanshan Zhang（张珊珊）内曼尼娅·朱里奇S.Vuacetic公司

计算机科学

国际计算…会议…

2020

结果表明，该方法在5个词的相似度数据集上的性能优于现有算法，并且可以成功地应用于职称规范化，这是电子招聘领域中的一个重要问题，也是OOV问题。

无分段组合n元嵌入

金吉郁福井和贵下田英寿

计算机科学

美国…协会北美分会…

2019

该方法的主要思想是完全忽略单词边界，在一个原始语料库中通过嵌入合成子n元来构建所有字符n元的表示。

5

[PDF]（PDF格式）

基于复合n-Gram特征的句子嵌入无监督学习

马泰奥·帕利亚迪尼普拉哈尔·古普塔马丁·贾吉

计算机科学

美国…协会北美分会…

2018

这项工作提出了一个简单但有效的无监督目标来训练句子的分布式表示，在大多数基准任务上，该目标优于最先进的无监督模型，突出了生成的通用句子嵌入的健壮性。

[PDF]（PDF格式）

基于双线性卷积网络的无监督单词表征学习

托马斯·卢卡L.苏利埃大卫·皮卡德

计算机科学、数学

欧洲人工神经科学研讨会…

2021

提出了一种新的无监督学习方法，用于学习以原始字符作为输入表示的单词嵌入，绕过了使用字典所产生的问题，该方法允许只考虑编码器而不考虑编码器-解码器结构。

PDF格式

基于字符级文本嵌入的文本分割

Grzegorz Chrupała公司

计算机科学、语言学

机器学习国际会议

2013

这项工作提出通过训练简单递归网络来预测文本中的下一个字符，直接从原始字符序列中学习文本表示，并在监督的字符级文本分割和标记任务中使用所学习的文本嵌入作为特征。

35

[PDF]（PDF格式）

使用编辑脚本和递归神经嵌入规范化推文

Grzegorz Chrupała公司

计算机科学

…协会年会…

2014

这项工作提出了一种新的文本规范化模型，该模型基于从标记数据中学习编辑操作，同时通过字符级神经文本嵌入结合从未标记数据中诱导的特征，这大大降低了英语推特规范化数据集上的单词错误率。

在形式中发现功能：开放词汇词汇表示的组合字符模型

王玲克里斯·戴尔蒂亚戈·路易斯

计算机科学

自然科学中的实证方法会议…

2015

一种通过使用双向LSTM组合字符来构建单词向量表示的模型，该模型只需要每个字符类型一个向量和组合模型的一组固定参数，从而产生语言建模和部分语音标记的最新结果。

628

[PDF]（PDF格式）

字符和单词嵌入的联合学习

陈新雄雷旭刘志远孙茂松环波栾

计算机科学

国际人工…联合会议…

2015

针对字符歧义和非合成词问题，提出了一种基于字符增强的单词嵌入模型（CWE），并对该模型在单词相关性计算和类比推理方面的有效性进行了评估。

基于卷积神经网络的多视角句子相似度建模

华河凯文·金佩尔吉米·J·林

计算机科学、语言学

自然…实证方法会议…

2015

这项工作提出了一个使用多种视角的句子比较模型，首先使用卷积神经网络对每个句子进行建模，该网络在多个粒度级别提取特征，并使用多种类型的池。

使用C-PHRASE模型联合优化词汇和句子任务的单词表示

N.范Germanán Kruszewski先生安吉利基·拉扎里杜巴罗尼

计算机科学

…协会年会…

2015

C-PHRASE是一种分布式语义模型，它通过优化句法树中各个层次短语的上下文预测来学习单词表示，在各种词汇任务上，它的表现优于状态中心C-BOW模型。

词汇表征与语素表征的协同学习

邱思玉青翠蒋边Bin Gao公司刘铁雁

计算机科学

国际计算…会议…

2014

本文将形态学知识作为额外的输入表示和辅助监督引入神经网络框架，并将产生语素表示，这些语素表示可以进一步用于根据稀有或未知单词的形态学结构推断其表示。

基于对称模式的单词嵌入改进单词相似度预测

罗伊·施瓦茨罗伊·赖查特A.拉波波特

计算机科学

计算自然语言会议…

2015

一种基于对称模式（SP）的新词级向量表示法在动词上表现出色，该方法和word2vec生成的单词相似性分数的简单组合使其预测能力优于每个单独的模型。

用于文本分类的深层无序成分竞争句法方法

莫希特·伊耶瓦伦·曼朱纳塔乔丹·L·博伊德·格雷伯哈尔·达姆

计算机科学、语言学

…协会年会…

2015

这项工作提出了一个简单的深度神经网络，它在情感分析和事实性问题回答任务上与此类模型竞争，在某些情况下，其性能优于此类模型，而只需花费一小部分训练时间。

特征感知神经语言模型

尹金（Yoon Kim）亚辛·杰尼特D.桑塔格亚历山大·拉什

计算机科学、语言学

AAAI人工智能会议

2016

一种简单的神经语言模型，它只依赖字符级输入，能够仅从字符编码语义和正字法信息，并表明在许多语言上，字符输入足以进行语言建模。

[PDF]（PDF格式）