Learning to Selectively Learn for Weakly-supervised Paraphrase Generation

Kaize Ding; Dingcheng Li; Alexander Hanbo Li; Xing Fan; Chenlei Guo; Yang Liu; Huan Liu

doi:10.18653/v1/2021.emnlp-main.480

学习有选择地学习弱监督短语生成

凯泽鼎,李定成,亚历山大·汉波（Alexander Hanbo Li）,邢凡,郭晨雷,杨柳,刘欢

摘要

释义生成是一项长期存在的NLP任务，在下游NLP任务中有多种应用。然而，现有工作的有效性主要依赖于大量贴金数据。虽然已经提出了非监督措施来缓解这个问题，但由于缺乏监督信号，这些措施可能无法产生有意义的解释。在这项工作中，我们超越了现有的范式，提出了一种新的方法，用监管薄弱的数据生成高质量的释义。具体来说，我们解决了弱监督复述生成问题：（1）通过基于检索的伪复述扩展获得丰富的弱标记平行句；（2）开发一个元学习框架，逐步选择有价值的样本，对句子复述任务中的预训练语言模型BART进行微调。我们证明，与现有的无监督方法相比，我们的方法取得了显著的改进，并且在性能上甚至可以与有监督的现状相媲美。

选集ID：: 2021.emnlp-main.480年
体积：: 2021年自然语言处理实证方法会议记录
月份：: 十一月
年份：: 2021
地址：: 多米尼加共和国Online和Punta Cana
编辑：: 玛丽·弗朗辛·莫恩斯,黄宣景,露西亚特色菜,斯科特·文涛（Scott Wen-tau Yih）
地点：: EMNLP公司
SIG公司：
出版商：: 计算语言学协会
注：
页：: 5930–5940
语言：
网址：: https://aclantology.org/2021.emnlp-main.480
内政部：: 10.18653/v1/2021.emnlp-main.480
比比键：
引用（ACL）：: 丁凯泽、李定成、李汉波、邢凡、郭晨雷、杨柳和刘欢。2021学习有选择地学习弱监督短语生成.英寸2021年自然语言处理实证方法会议记录，第5930–5940页，在线和多米尼加共和国卡纳角。计算语言学协会。
引用（非正式）：: 学习有选择地学习弱监督短语生成（丁等人，EMNLP 2021）
复制引文：
PDF格式：: https://aclantology.org/2021.emnlp-main.480.pdf
视频：: https://aclantology.org/2021.emnlp-main.480.mp4网址
数据: 中景COCO

PDF格式引用搜索视频