M(M)质量单位:使用混合答案类型生成神经问题

Lidiya Murakhovs'ka女士,吴建胜,菲利普·拉班,童牛,刘文浩,熊才明


摘要
提出好的问题是人类和机器智能的基本能力。然而,现有的神经问题生成方法主要关注短事实类型的答案。在本文中,我们引入了一个神经问题生成器MixQG来弥补这一差距。我们将九个问答数据集与不同的答案类型相结合,包括是/否、多项选择、提取和抽象答案,以训练单个生成模型。我们的实证结果表明,我们的模型在可见和不可见领域都优于现有的研究,并且当以不同的答案类型为条件时,可以生成具有不同认知水平的问题。我们进行了一项人体评估研究,以评估生成问题的质量,并发现MixQG比次佳模型的表现要好10%。我们的代码和模型检查点将被发布,并与HuggingFace库集成,以方便各种下游应用程序。
选集ID:
2022.结果-naacl.111
体积:
计算语言学协会的研究结果:NAACL 2022
月份:
七月
年份:
2022
地址:
美国西雅图
编辑:
海洋木瓜,玛丽·凯瑟琳·德·马内夫,伊万·弗拉基米尔·梅扎·鲁伊斯
地点:
调查结果
SIG公司:
发布者:
计算语言学协会
注:
页码:
1486–1497
语言:
网址:
https://aclantology.org/2022.findings-naacl.111
内政部:
10.18653/v1/2022。命名名称111
比比键:
引用(ACL):
Lidiya Murakhovs'ka、吴建胜、菲利普·拉班、童牛、刘文浩和熊才明。2022MixQG:混合答案类型的神经问题生成.英寸计算语言学协会的研究结果:NAACL 2022第1486–1497页,美国西雅图。计算语言学协会。
引用(非正式):
MixQG:混合答案类型的神经问题生成(Murakhovs'ka等人,2022年发现)
复制引文:
PDF格式:
https://aclantology.org/2022.findings-naacl.111.pdf
视频:
 https://acl选集.org/2022.findings-nameacl.111.mp4
代码
salesforce/qgen
数据
布尔Q下降MC测试叙事QA自然问题Quoref(引用)小队