释义生成的深层生成框架

作者

  • 安库什·古普塔 IBM印度研究院
  • 阿文德·阿加瓦尔 IBM印度研究院
  • 普瓦安·辛格 坎普尔印度理工学院
  • 皮尤什·雷 坎普尔印度理工学院

DOI(操作界面):

https://doi.org/10.1609/aaai.v32i1.11956

关键词:

释义生成、变分自动编码器、问题释义

摘要

释义生成是NLP中的一个重要问题,特别是在问答、信息检索、信息提取、会话系统等方面。在本文中,我们解决了自动生成转述的问题。我们提出的方法是基于深度生成模型(VAE)和序列到序列模型(LSTM)的组合,在给定输入句子的情况下生成复述。传统的VAE与递归神经网络相结合可以生成自由文本,但不适用于特定句子的释义生成。我们通过调节VAE的编码器和解码器两侧对原始句子的条件来解决这个问题,以便它能够生成给定句子的复述。与大多数现有模型不同,我们的模型简单、模块化,可以为给定句子生成多个释义。在基准释义数据集上对所提方法进行的定量评估证明了其有效性,并且与最先进的方法相比,其性能有了显著提高,而人类定性评估表明,生成的释义格式良好,语法正确,和与输入句子相关。此外,我们在一个新发布的问题复述数据集上评估了我们的方法,并为未来的研究建立了新的基线。

下载

出版

2018-04-27

如何引用

Gupta,A.、Agarwal,A.、Singh,P.和Rai,P.(2018年)。释义生成的深层生成框架。AAAI人工智能会议记录,32(1). https://doi.org/10.1609/aaai.v32i1.11956

问题

章节

主要方向:NLP和机器学习