质量保证@MPII-D5
简单QA
QUINT(2017年EMNLP)
复杂QA
ComQA(NAACL 2019)
奎斯特(SIGIR 2019)
CLOCQ(WSDM 2022)
UNIQORN(2023年)
CompMix(WWW 2024)
临时QA
特基拉(CIKM 2018)
EXAQT(CIKM 2021)
信仰(WWW 2024)
异构QA
公民(SIGIR 2022)
UNIQORN(2023年)
解释(SIGIR 2023)
CompMix(WWW 2024)
信仰(WWW 2024)
对话式QA
CONVEX(CIKM 2019)
皇冠(SIGIR 2020)
征服(SIGIR 2021)
公民(SIGIR 2022)
解释(SIGIR 2023)
雷根(WSDM 2024)
概述
CONVINSE+ConvMix公司
异质源对话问答
公民
此页面位于
2022长纸
关于异质来源的对话问答。
我们提供
扩展视频
作为作品的介绍(也有一段较短的视频
在这里
).
到CONVINSE代码的GitHub链接
直接下载CONVINSE代码
演示
答案
清除最后一个
全部清除
请不要将此演示用于比较目的!
此演示仅用于演示一般工作流和结构化表示(SR)的构造。
为了在CPU上运行该方法,我们调整了管道的几个部分,这可能会导致性能下降。
说明
对话式问答(ConvQA)解决了后续问题中隐含上下文的连续信息需求。
当前的ConvQA系统在同质的信息源上运行:要么是知识库(KB),要么是文本语料库,要么是表格集合。
本文提出了一个新的问题,即共同利用所有这些,以提高答案的覆盖率和信心。
我们介绍了CONVINSE,这是一个跨异构源的ConvQA端到端管道,分三个阶段运行:i)学习传入问题及其对话上下文的显式结构化表示,ii)利用这种框架式表示统一地从知识库、文本和表中捕获相关证据,
以及iii)运行融合解码模型以生成答案。
我们为跨异构源的ConvQA构建并发布了第一个基准,ConvMix,包括3000个真实用户对话,16000个问题,以及实体注释、完整的问句和问题释义。
实验表明,与最先进的基线相比,我们的方法具有可行性和优势。
联系人
有关反馈和澄清,请联系:
菲利普·克里斯特曼
(在mpi HYPHEN inf DOT mpg DOT de的圣诞节),
里希拉吉·萨哈·罗伊
(rishiraj AT mpi HYPHEN inf DOT mpg DOT de)或
格哈德·威库姆
(威库姆在mpi HYPHEN inf DOT mpg DOT de)。
要了解我们团队的更多信息,请访问
https://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/question-answering/
.
下载ConvMix
训练集(1680次对话)
开发人员集(560次对话)
测试集(760个对话)
请结账
CompMix公司
,我们的异构QA新数据集,整理ConvMix中会话问题的完整版本。
ConvMix和CompMix基准根据
Creative Commons Attribution 4.0国际许可
.
ConvMix排行榜
模型
P@1处
MRR公司
点击@5
解释
Christmann等人'23
0.406
0.471
0.561
公民
(顶部-
k个
FiD)
0.343
0.378
0.431
公民
Christmann等人'22
0.342
0.365
0.386
问题解决
Voskarides等人'20
+BM25+FiD
0.282
0.289
0.297
问题改写
Raposo等人'22
+BM25+FiD
0.271
0.278
0.285
ConvMix中的对话是什么样子的?
书
影视
音乐
电视连续剧
足球
《五号屠宰场》是谁写的?
库尔特·冯内古特
[KB,文本,信息框]
书中讨论了哪场战争?
第二次世界大战
[KB,文本]
它的第一部改编电影是哪一年发行的?
1972
[KB,文本,表格,信息框]
谁导演的?
乔治·罗伊·希尔
[KB,文本,表格,信息框]
他拍的最后一部电影是什么?
有趣的农场
[KB,文本,表格]
谁在哈利波特电影中扮演罗恩?
鲁珀特·格林特
[KB,文本]
谁扮演邓布利多?
R.Harris,M.Gambon
[文本,表格]
所有电影的运行时间加起来是多少?
1179分钟
[KB,信息框]
谁是电影的制作设计师?
斯图尔特·克莱格
[KB,文本,表格]
他在1980年创作的哪部电影获得了奖项?
大象人
[文本]
披头士乐队最后一张专辑是什么?
顺其自然
[KB,文本,表格]
他们最后一次付费音乐会在哪里举行?
烛台公园
[文本]
他们是哪年分手的?
1970
[KB,文本,信息框]
谁是他们的经理?
布莱恩·爱泼斯坦
[KB,文本]
他们的昵称是什么?
Fab Four公司
[KB,文本]
《行尸走肉》中里克·格里姆斯的扮演者是谁?
安德鲁·林肯
[KB,文本,表格]
Daryl Dixon怎么样?
诺曼·里杜斯
[KB,文本,表格]
他也参加了周六晚上的现场直播吗?
是的
[文本]
他和谁比赛?
达里尔
[文本]
该系列的生产公司?
摄影棚
[KB,文本,信息框]
凯利安·姆巴佩普为哪个国家队踢球?
法国足球队
[KB,文本,信息框,表格]
2018年,他为祖国进了多少球?
9
[表]
他的出生地?
巴黎
[KB,文本,信息框]
他在2017年获得的奖项?
金色男孩
[KB,表格]
奖项由谁颁发?
全体育
[KB,文本,信息框]
方括号中的来源是可以在其中找到相应答案的来源。
ConvMix是如何创建的?
这个
ConvMix公司
基准测试是由真人创建的,我们试图确保收集的数据尽可能自然。
总的来说,它包含3000个对话和16000个独特的问题。
掌握众工
Amazon Mechanical Turk(AMT)选择了一个特定领域中感兴趣的实体,然后开始就这个实体发出对话问题,在整个对话过程中可能会转移到其他感兴趣的话题。
通过让用户自己选择实体,我们旨在确保他们对对话所基于的主题更感兴趣。
在写了一个问题后,用户被要求在其他选项中找到答案
维基数据
,
维基百科文本
,一个
维基百科表
或a
维基百科信息框
,无论他们觉得手头的具体问题更自然。
由于Wikidata需要对知识库有一些基本的了解,因此我们提供了视频指南,在一次示例对话之后,说明了如何使用Wiki数据来检测答案。
我们不仅提供问题和答案,还提供用户在其中找到答案的答案来源、释义、完成的问题和问题实体。
有关ConvMix的更多详细信息,请参阅
纸张
.
纸类
“关于异质来源的对话问答”
菲利普·克里斯特曼(Philipp Christmann)、里希拉杰·萨哈·罗伊(Rishiraj Saha Roy)和格哈德·魏库姆(Gerhard Weikum)。
在
SIGIR’22号
2022年7月11日至15日,西班牙马德里。
[
预打印
] [
代码
] [
海报
] [
幻灯片
] [
视频
] [
扩展视频
] [
用户研究
]