公民

此页面位于2022长纸关于异质来源的对话问答。我们提供扩展视频作为作品的介绍(也有一段较短的视频在这里).
到CONVINSE代码的GitHub链接 直接下载CONVINSE代码

演示

请不要将此演示用于比较目的!此演示仅用于演示一般工作流和结构化表示(SR)的构造。为了在CPU上运行该方法,我们调整了管道的几个部分,这可能会导致性能下降。

说明

对话式问答(ConvQA)解决了后续问题中隐含上下文的连续信息需求。当前的ConvQA系统在同质的信息源上运行:要么是知识库(KB),要么是文本语料库,要么是表格集合。本文提出了一个新的问题,即共同利用所有这些,以提高答案的覆盖率和信心。我们介绍了CONVINSE,这是一个跨异构源的ConvQA端到端管道,分三个阶段运行:i)学习传入问题及其对话上下文的显式结构化表示,ii)利用这种框架式表示统一地从知识库、文本和表中捕获相关证据,以及iii)运行融合解码模型以生成答案。我们为跨异构源的ConvQA构建并发布了第一个基准,ConvMix,包括3000个真实用户对话,16000个问题,以及实体注释、完整的问句和问题释义。实验表明,与最先进的基线相比,我们的方法具有可行性和优势。

联系人

有关反馈和澄清,请联系:菲利普·克里斯特曼(在mpi HYPHEN inf DOT mpg DOT de的圣诞节),里希拉吉·萨哈·罗伊(rishiraj AT mpi HYPHEN inf DOT mpg DOT de)或格哈德·威库姆(威库姆在mpi HYPHEN inf DOT mpg DOT de)。

要了解我们团队的更多信息,请访问https://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/question-answering/.

下载ConvMix

训练集(1680次对话) 开发人员集(560次对话) 测试集(760个对话) 请结账CompMix公司,我们的异构QA新数据集,整理ConvMix中会话问题的完整版本。 ConvMix和CompMix基准根据Creative Commons Attribution 4.0国际许可.
Creative Commons许可证

ConvMix排行榜

模型 P@1处 MRR公司 点击@5
解释
Christmann等人'23
0.406 0.471 0.561
公民(顶部-k个FiD) 0.343 0.378 0.431
公民
Christmann等人'22
0.342 0.365 0.386
问题解决
Voskarides等人'20
+BM25+FiD
0.282 0.289 0.297
问题改写
Raposo等人'22
+BM25+FiD
0.271 0.278 0.285

ConvMix中的对话是什么样子的?


《五号屠宰场》是谁写的?
库尔特·冯内古特
[KB,文本,信息框]
书中讨论了哪场战争?
第二次世界大战
[KB,文本]
它的第一部改编电影是哪一年发行的?
1972
[KB,文本,表格,信息框]
谁导演的?
乔治·罗伊·希尔
[KB,文本,表格,信息框]
他拍的最后一部电影是什么?
有趣的农场
[KB,文本,表格]

谁在哈利波特电影中扮演罗恩?
鲁珀特·格林特
[KB,文本]
谁扮演邓布利多?
R.Harris,M.Gambon
[文本,表格]
所有电影的运行时间加起来是多少?
1179分钟
[KB,信息框]
谁是电影的制作设计师?
斯图尔特·克莱格
[KB,文本,表格]
他在1980年创作的哪部电影获得了奖项?
大象人
[文本]

披头士乐队最后一张专辑是什么?
顺其自然
[KB,文本,表格]
他们最后一次付费音乐会在哪里举行?
烛台公园
[文本]
他们是哪年分手的?
1970
[KB,文本,信息框]
谁是他们的经理?
布莱恩·爱泼斯坦
[KB,文本]
他们的昵称是什么?
Fab Four公司
[KB,文本]

《行尸走肉》中里克·格里姆斯的扮演者是谁?
安德鲁·林肯
[KB,文本,表格]
Daryl Dixon怎么样?
诺曼·里杜斯
[KB,文本,表格]
他也参加了周六晚上的现场直播吗?
是的
[文本]
他和谁比赛?
达里尔
[文本]
该系列的生产公司?
摄影棚
[KB,文本,信息框]

凯利安·姆巴佩普为哪个国家队踢球?
法国足球队
[KB,文本,信息框,表格]
2018年,他为祖国进了多少球?
9
[表]
他的出生地?
巴黎
[KB,文本,信息框]
他在2017年获得的奖项?
金色男孩
[KB,表格]
奖项由谁颁发?
全体育
[KB,文本,信息框]

方括号中的来源是可以在其中找到相应答案的来源。

ConvMix是如何创建的?

这个ConvMix公司基准测试是由真人创建的,我们试图确保收集的数据尽可能自然。总的来说,它包含3000个对话和16000个独特的问题。掌握众工Amazon Mechanical Turk(AMT)选择了一个特定领域中感兴趣的实体,然后开始就这个实体发出对话问题,在整个对话过程中可能会转移到其他感兴趣的话题。通过让用户自己选择实体,我们旨在确保他们对对话所基于的主题更感兴趣。在写了一个问题后,用户被要求在其他选项中找到答案维基数据,维基百科文本,一个维基百科表或a维基百科信息框,无论他们觉得手头的具体问题更自然。由于Wikidata需要对知识库有一些基本的了解,因此我们提供了视频指南,在一次示例对话之后,说明了如何使用Wiki数据来检测答案。我们不仅提供问题和答案,还提供用户在其中找到答案的答案来源、释义、完成的问题和问题实体。有关ConvMix的更多详细信息,请参阅纸张.

纸类

“关于异质来源的对话问答”菲利普·克里斯特曼(Philipp Christmann)、里希拉杰·萨哈·罗伊(Rishiraj Saha Roy)和格哈德·魏库姆(Gerhard Weikum)。SIGIR’22号2022年7月11日至15日,西班牙马德里。
[预打印] [代码] [海报] [幻灯片] [视频] [扩展视频] [用户研究]