文件Zbl 1390.68698-zbMATH打开

用于统计机器翻译的局部信息双语约束递归自动编码器。（英语） Zbl 1390.68698号

Commun公司。信息系统。 18，第1期，53-72（2018）.

摘要：学习高质量的短语向量表示是统计机器翻译的重要研究课题之一。在短语嵌入方面，现有的大多数研究主要探索短语内部单词之间的句法和语义线索，但由于缺乏上下文信息，这些线索不足以进行表征学习。在本文中，我们提出了用于SMT的主题信息双语约束递归自编码器，它通过两种方式利用潜在主题，大大扩展了传统的双语约束递归自动编码器。首先，我们引入主题语境来诱导主题短语嵌入。其次，利用潜在主题模型中的词-主题分配来约束词和主题嵌入的学习，这两者构成了该模型中上下文短语嵌入学习的基础。汉英翻译实验结果表明，该模型显著提高了NIST测试集的翻译质量。

MSC公司：

68T50型	自然语言处理
68T05型	人工智能中的学习和自适应系统

关键词：

统计机器翻译；学习高质量的短语向量表示；潜在主题；翻译质量

PDF格式 BibTeX公司 XML格式引用

全文：内政部

任何	在任何地方
一个	内部文档标识符
澳大利亚	作者、编辑
人工智能	内部作者标识符
钛	标题
洛杉矶	语言
所以	来源
ab公司	回顾，摘要
第页	出版年份
车辆	评审员
复写的副本	MSC代码
美国犹他州	关键字
日期	文档类型(j个：期刊文章；b条：book；一：图书文章）

一&b条	逻辑和
一\|b条	逻辑或
!ab公司	逻辑不
美国广播公司*	右通配符
"ab c公司"	短语
(ab c公司)	圆括号

示例

领域

操作员

用于统计机器翻译的局部信息双语约束递归自动编码器。（英语） Zbl 1390.68698号

MSC公司：

关键词：

示例

领域

操作员

用于统计机器翻译的局部信息双语约束递归自动编码器。 （英语） Zbl 1390.68698号

MSC公司：

关键词：

用于统计机器翻译的局部信息双语约束递归自动编码器。（英语） Zbl 1390.68698号