M(M)多用途V(V)S公司:在监管薄弱和文档完整的情况下改进科学索赔验证

大卫·沃登,凯尔·洛,露西·路·王,阿曼·科汉,伊兹·贝尔塔基,Hannaneh Hajishirzi公司


摘要
科学索赔验证任务要求NLP系统标记支持或反驳输入索赔的科学文档,并选择证明每个预测标签合理性的证据句子(或理由)。在这项工作中,我们展示了MultiVerS,它预测了一个事实检查标签,并基于声明的共享编码和完整文档上下文,以多任务的方式识别基本原理。这种方法实现了两个关键的建模目标。首先,它确保所有相关的上下文信息都被纳入到每个标签决策中。其次,它使模型能够从使用文档级事实检查标签注释的实例中学习,但缺乏句子级的理由。这使得MultiVerS能够通过对使用高精度启发式标记的科学文档进行训练来执行弱监督的域适应。在三个科学索赔验证数据集上,我们的方法优于两个具有竞争力的基线,在零/少快照域自适应实验中表现尤为突出。我们的代码和数据可在https://github.com/dwadden/multivers网站.
选集ID:
2022.发现-naacl.6
体积:
计算语言学协会的研究结果:NAACL 2022
月份:
七月
年份:
2022
地址:
美国西雅图
编辑:
海洋木瓜,玛丽·凯瑟琳·德·马内夫,伊万·弗拉基米尔·梅扎·鲁伊斯
地点:
调查结果
SIG公司:
出版商:
计算语言学协会
注:
页:
61–76
语言:
网址:
https://aclantology.org/2022.findings-naacl.6
内政部:
10.18653/v1/2022。调查结果naacl.6
比比键:
引用(ACL):
David Wadden、Kyle Lo、Lucy Lu Wang、Arman Cohan、Iz Beltagy和Hannaneh Hajishirzi。2022.MultiVerS:在监管薄弱和文档完整的情况下改进科学索赔验证.英寸计算语言学协会的研究结果:NAACL 2022,第61-76页,美国西雅图。计算语言学协会。
引用(非正式):
MultiVerS:在监管薄弱和文档完整的情况下改进科学索赔验证(Wadden等人,《2022年调查结果》)
复制引文:
PDF格式:
https://aclantology.org/2022.findings-naacl.6.pdf
视频:
 https://aclantology.org/2022.findings-naacl.6mp4
代码
dwadden/longchecker+附加社区代码
数据
CORD-19系列活动盖TREC-COVID病毒