链接到我们在SIGIR 2023中的后续工作: 解释 .
问题理解(QU)——创建传入问题及其对话上下文的明确表示 证据检索和评分(ERS)——利用这种框架式表示统一捕获来自不同来源的最相关证据 异质回答(HA)——从这些证据中得出答案。
@正在进行中 { 2022年圣诞节 , 标题 = { 异质源对话问答 } , 作者 = { 菲利普·克里斯特曼(Philipp Christmann)和萨哈·罗伊(Saha Roy)、里希拉吉(Rishiraj)和格哈德·威库姆(Gerhard Weikum) } , 书名 = { SIGIR公司 } , 页 = { 144--154 } , 年 = { 2022 } }
git克隆 https://github.com/PhilippChr/CONVINSE.git 光盘 公民/ 公民_根= $( 密码 ) conda create--name convense python=3.8 conda激活罪犯 pip安装-e .
# 不带CUDA安装PyTorch 康达公司安装pytorch torchvision torchaudio-c pytorch # 为CUDA 10.2安装PyTorch(使用GPU) conda install pytorch torchvision torchhavetcudatoolkit=10.2-c pytorch # 为CUDA 11.3安装PyTorch(使用GPU) conda安装pytorch torchvision torchaudio cudatoolkit=11.3-c pytorch
git克隆 https://github.com/PhilippChr/CLOCQ.git 光盘 CLOCQ公司/ pip安装-e .
光盘 $CONVINSE_ROOT(目录_根) git克隆 https://github.com/PhilippChr/FiD.git 说服/异构应答/fid_module/fid 光盘 说服/异构应答/fid_module/fid/ conda create--名称fid python=3.6 conda激活fid pip安装-e . conda激活罪犯
光盘 说服/问题理解/问题解决/ git克隆 https://github.com/nickwosk/sigir2020-查询-解决方案.git quretec公司
光盘 $CONVINSE_ROOT(目录_根) bash脚本/initialize.sh
bash脚本/pipeline.sh--主结果
bash脚本/pipeline.sh--gold-answers config/convmix/convense.yml kb_text_table_info
bash脚本/pipeline.sh—训练[ < 路径_配置 > ] [ < 来源_STR > ]
bash脚本/pipeline.sh—训练配置/convmix/convense.yml kb_text_table_info
bash脚本/pipeline.sh——示例[ < 路径_配置 > ]
bash脚本/pipeline.sh--黄金应答[ < 路径_配置 > ] [ < 来源_STR > ]
bash脚本/pipeline.sh--gold-answers config/convmix/convense.yml kb_text_table_info
bash脚本/pipeline.sh--主结果[ < 路径_配置 > ] [ < 来源_STR > ]
bash脚本/pipeline.sh--主结果config/convmix/convense.yml kb_text_table_info
bash脚本/pipeline.sh--预先应答[ < 路径_配置 > ] [ < 来源_STR > ]
bash脚本/pipeline.sh--预先应答config/convmix/convense.yml kb_text_table_info
bash脚本/下载.sh confmix
导入json 打开(“_benchmarks/convmix/train_set_ALL.json”,“r”)作为fp: 列车数据=json.load(fp) 打开(“_benchmarks/convmix/dev_set_ALL.json”,“r”)作为fp: dev_data=json.load(fp) 将open(“_benchmarks/convmix/test_set_ALL.json”,“r”)作为fp: test_data=json.load(fp)
[ //第一次对话 { “conv_id”:“<INT>”, “域”:“<STRING>”, “问题”:[ //问题1(完成) { “转弯”:0, “question_id”:“<STRING:question-id>”, “问题”:“<STRING:question>”, “答案”:[ { “id”:“<STRING:Wikidata答案id>”, “标签”:“<STRING:答案的项目标签> }, ] “answer_text”:“<STRING:答案的文本形式>”, “answer_src”:“<STRING:source worker found the answer>”, “实体”:[ { “id”:“<STRING:问题实体的Wikidata id>”, “label”:“<STRING:问题实体的项目标签> }, ], “改写”:“<STRING:改写当前问题>” }, //问题2(不完整) { “转弯”:1, “question_id”:“<STRING:question-id>”, “问题”:“<STRING:question>”, “答案”:[ { “id”:“<STRING:Wikidata答案id>”, “标签”:“<STRING:答案的项目标签> }, ] “answer_text”:“<STRING:答案的文本形式>”, “answer_src”:“<STRING:source worker found the answer>”, “实体”:[ { “id”:“<STRING:问题实体的Wikidata id>”, “label”:“<STRING:问题实体的项目标签> }, ], “释义”:“<STRING:当前问题释义>”, “已完成”:“<STRING:当前未完成问题的已完成版本>” ] }, //第二次对话 { ... }, // ... ]
…您可以使用我们专门的维基百科转储,以获得类似的维基百科版本(请参阅下面的更多详细信息)。 …您使用相同的Wikidata转储(2022-01-31),可以使用CLOCQ API方便地访问该转储,网址为 https://clocq.mpi-inf.mpg.de (详见下文)。 …您使用与CONVINSE相同的评估方法(如convense/evaluation.py中的定义)。
bash脚本/下载.sh维基百科
ConvMix基准中的所有应答实体, ConvMix基准中的所有问题实体(由众工作者指定), CLOCQ检测到的每个实体提及的前20个歧义消除,输入字符串是CONVINSE管道为ConvMix数据集生成的意图明确形式,或基于“Prepend all”QU方法构建的基线, 每当出现新的Wikidata实体时(例如,对于运行预测答案的管道的动态设置),我们都会将相应的证据添加到转储中。