DialFact: A Benchmark for Fact-Checking in Dialogue

Prakhar Gupta; Chien-Sheng Wu; Wenhao Liu; Caiming Xiong

doi:10.18653/v1/2022.acl-long.263

D类国际实验室F类行为：对话中事实检验的基准

摘要

事实核查是减少错误信息和虚假信息传播的重要工具。我们介绍了对话中的事实检验任务，这是一个相对尚未探索的领域。我们构建了DialFact，这是一个测试基准数据集，包含22245条带注释的对话声明，以及来自维基百科的一些证据。DialFact中有三个子任务：1）可验证索赔检测任务区分响应是否包含可验证的事实信息；2）证据检索任务检索最相关的维基百科片段作为证据；3）索赔验证任务预测对话响应得到支持、反驳或信息不足。我们发现，现有的基于FEVER等非对话数据训练的事实检验模型在我们的任务中表现不佳，因此，我们提出了一个简单但数据高效的解决方案，以有效提高对话中的事实检验性能。我们指出DialFact所面临的独特挑战，如在错误分析中处理口语、同义词和检索歧义，以期为今后这方面的研究提供参考。

选集ID：: 2022.acl长263
体积：: 计算语言学协会第60届年会论文集（第一卷：长篇论文）
月份：: 五月
年份：: 2022
地址：: 爱尔兰都柏林
编辑：: 斯玛兰达·穆雷桑,普雷斯拉夫·纳科夫,阿琳·维拉维森西奥
地点：: 国际计算语言学协会
SIG公司：
发布者：: 计算语言学协会
注：
页：: 3785–3801
语言：
网址：: https://aclantology.org/2022.acl-long.263
内政部：: 10.18653/v1/2022.acl长度263
比比键：
引用（ACL）：: Prakhar Gupta、吴建胜、刘文浩和熊才明。2022对话事实：对话中事实检验的基准.英寸计算语言学协会第60届年会论文集（第一卷：长篇论文）第3785–3801页，爱尔兰都柏林。计算语言学协会。
引用（非正式）：: 对话事实：对话中事实检验的基准（Gupta等人，ACL 2022）
复制引文：
PDF格式：: https://aclantology.org/2022.acl-long.263.pdf
视频：: https://acl选集.org/2022.acl-long.263.mp4
代码: 销售人员/拨号+附加社区代码
数据: 拨号事实, 发热, 维生素C, 维基百科向导

PDF格式引用搜索代码视频