D类国际实验室F类行为:对话中事实检验的基准

普拉哈尔·古普塔,吴建胜,刘文浩,熊才明


摘要
事实核查是减少错误信息和虚假信息传播的重要工具。我们介绍了对话中的事实检验任务,这是一个相对尚未探索的领域。我们构建了DialFact,这是一个测试基准数据集,包含22245条带注释的对话声明,以及来自维基百科的一些证据。DialFact中有三个子任务:1)可验证索赔检测任务区分响应是否包含可验证的事实信息;2) 证据检索任务检索最相关的维基百科片段作为证据;3) 索赔验证任务预测对话响应得到支持、反驳或信息不足。我们发现,现有的基于FEVER等非对话数据训练的事实检验模型在我们的任务中表现不佳,因此,我们提出了一个简单但数据高效的解决方案,以有效提高对话中的事实检验性能。我们指出DialFact所面临的独特挑战,如在错误分析中处理口语、同义词和检索歧义,以期为今后这方面的研究提供参考。
选集ID:
2022.acl长263
体积:
计算语言学协会第60届年会论文集(第一卷:长篇论文)
月份:
五月
年份:
2022
地址:
爱尔兰都柏林
编辑:
斯玛兰达·穆雷桑,普雷斯拉夫·纳科夫,阿琳·维拉维森西奥
地点:
国际计算语言学协会
SIG公司:
发布者:
计算语言学协会
注:
页:
3785–3801
语言:
网址:
https://aclantology.org/2022.acl-long.263
内政部:
10.18653/v1/2022.acl长度263
比比键:
引用(ACL):
Prakhar Gupta、吴建胜、刘文浩和熊才明。2022对话事实:对话中事实检验的基准.英寸计算语言学协会第60届年会论文集(第一卷:长篇论文)第3785–3801页,爱尔兰都柏林。计算语言学协会。
引用(非正式):
对话事实:对话中事实检验的基准(Gupta等人,ACL 2022)
复制引文:
PDF格式:
https://aclantology.org/2022.acl-long.263.pdf
视频:
 https://acl选集.org/2022.acl-long.263.mp4
代码
销售人员/拨号+附加社区代码
数据
拨号事实发热维生素C维基百科向导