学习有选择地学习弱监督短语生成

凯泽鼎,李定成,亚历山大·汉波(Alexander Hanbo Li),邢凡,郭晨雷,杨柳,刘欢


摘要
释义生成是一项长期存在的NLP任务,在下游NLP任务中有多种应用。然而,现有工作的有效性主要依赖于大量贴金数据。虽然已经提出了非监督措施来缓解这个问题,但由于缺乏监督信号,这些措施可能无法产生有意义的解释。在这项工作中,我们超越了现有的范式,提出了一种新的方法,用监管薄弱的数据生成高质量的释义。具体来说,我们解决了弱监督复述生成问题:(1)通过基于检索的伪复述扩展获得丰富的弱标记平行句;(2)开发一个元学习框架,逐步选择有价值的样本,对句子复述任务中的预训练语言模型BART进行微调。我们证明,与现有的无监督方法相比,我们的方法取得了显著的改进,并且在性能上甚至可以与有监督的现状相媲美。
选集ID:
2021.emnlp-main.480年
体积:
2021年自然语言处理实证方法会议记录
月份:
十一月
年份:
2021
地址:
多米尼加共和国Online和Punta Cana
编辑:
玛丽·弗朗辛·莫恩斯,黄宣景,露西亚特色菜,斯科特·文涛(Scott Wen-tau Yih)
地点:
EMNLP公司
SIG公司:
出版商:
计算语言学协会
注:
页:
5930–5940
语言:
网址:
https://aclantology.org/2021.emnlp-main.480
内政部:
10.18653/v1/2021.emnlp-main.480
比比键:
引用(ACL):
丁凯泽、李定成、李汉波、邢凡、郭晨雷、杨柳和刘欢。2021学习有选择地学习弱监督短语生成.英寸2021年自然语言处理实证方法会议记录,第5930–5940页,在线和多米尼加共和国卡纳角。计算语言学协会。
引用(非正式):
学习有选择地学习弱监督短语生成(丁等人,EMNLP 2021)
复制引文:
PDF格式:
https://aclantology.org/2021.emnlp-main.480.pdf
视频:
 https://aclantology.org/2021.emnlp-main.480.mp4网址
数据
中景COCO