研究论文

用拟知识图结合多文档证据回答复杂问题

作者：
陆小璐

澳大利亚墨尔本皇家墨尔本理工大学

澳大利亚墨尔本皇家墨尔本理工大学
查看个人资料

,
Soumajit Pramanik公司

马克斯·普朗克信息学研究所，德国萨尔布鲁肯

马克斯·普朗克信息学研究所，德国萨尔布鲁肯
查看个人资料

,
里希拉吉·萨哈·罗伊

马克斯·普朗克信息学研究所，德国萨尔布鲁肯

马克斯·普朗克信息学研究所，德国萨尔布鲁肯
查看个人资料

,
阿卜杜勒加尼·阿布贾巴尔

亚马逊Alexa，德国亚琛

亚马逊亚历克萨，德国亚琛
查看个人资料

,
王亚芳

蚂蚁金融服务集团，中国杭州

蚂蚁金融服务集团，中国杭州
查看个人资料

,
格哈德·威库姆

马克斯·普朗克信息学研究所，德国萨尔布鲁肯

马克斯·普朗克信息学研究所，德国萨尔布鲁肯
查看个人资料

作者信息和声明

SIGIR’19：第42届国际ACM SIGIR信息检索研究与开发会议记录2019年7月第105-114页https://doi.org/10.1145/3331184.331252

出版：2019年7月18日出版历史

SIGIR’19：第42届国际ACM SIGIR信息检索研究与开发会议记录

第105-114页

摘要

对于基于文本的QA来说，直接回答涉及多个实体和关系的问题是一个挑战。当只能通过连接多个文档中的证据才能找到答案时，这个问题最为突出。Curated knowledge graphs（KG）可能会给出很好的答案，但其固有的不完整性和潜在的陈旧性限制了它。本文提出了一种通过计算不同文档的部分结果的相似性连接来直接从文本源中实时回答复杂问题的方法QUEST。我们的方法是完全无监督的，避免了训练数据瓶颈，能够应对用户问题中快速发展的特定主题和公式化风格。QUEST构建了一个带有节点和边缘权重的噪声准KG，由动态检索的实体名称和关系短语组成。它用类型和语义对齐来扩充该图，并通过组Steiner树的算法计算最佳答案。我们根据复杂问题的基准对QUEST进行了评估，并表明它大大优于最先进的基准。

补充材料

城市1-14h30-d1.mp4

英里4

456.4 MB

下载

工具书类

A.Abujabal、M.Yahya、M.Riedewald和G.Weikum。2017.知识图问答的自动模板生成。在WWW中。谷歌学者数字图书馆
E.Agichtein、D.Carmel、D.Pelleg、Y.Pinter和D.Harman。2015年，TREC 2015 LiveQA跟踪概述。在TREC中。谷歌学者
G.Angeli、M.J.J.Premkumar和C.D.Manning。2015.利用语言结构进行开放域信息提取。在ACL中。谷歌学者
S.Auer、C.Bizer、G.Kobilarov、J.Lehmann、R.Cyganiak和Z.Ives。2007年，DBpedia：开放数据网络的核心。在语义网中。斯普林格。谷歌学者数字图书馆
J.Bao、N.Duan、Z.Yan、M.Zhou和T.Zhao。2016。基于约束的知识图问答。在COLING中。谷歌学者
H.巴斯特和E.奥斯曼。2015年，在Freebase上更准确地回答问题。在CIKM中。谷歌学者数字图书馆
J.Berant、A.Chou、R.Frostig和P.Liang。2013.基于Freebase的问答对语义分析。在ACL中。谷歌学者
G.Bhalotia、A.Hulgeri、C.Nakhe、S.Chakrabarti和S.Sudarshan。2002.使用BANKS在数据库中进行关键字搜索和浏览。在ICDE中。谷歌学者数字图书馆
K.Bollacker、C.Evans、P.Paritosh、T.Sturge和J.Taylor。2008.Freebase：一个合作创建的图形数据库，用于构建人类知识。在SIGMOD中。谷歌学者数字图书馆
A.Bordes、N.Usunier、S.Chopra和J.Weston。2015年，使用存储网络进行大规模简单问答。在arXiv。谷歌学者
Q.Cai和A.Yates。2013.通过模式匹配和词汇扩展进行大规模语义分析。在ACL中。谷歌学者
D.Chen、A.Fisch、J.Weston和A.Bordes。2017.阅读维基百科回答开放域问题。在ACL中。谷歌学者
J.Coffman和A.C.Weaver。2014.关系关键字搜索技术的实证性能评估。在TKDE中。谷歌学者数字图书馆
L.Del Corro和R.Gemulla。2013.ClausIE：基于子句的开放信息提取。在WWW中。谷歌学者数字图书馆
R.Das、M.Zaheer、S.Reddy和A.McCallum。2017年，使用通用模式和记忆网络对知识库和文本进行问答。在ACL中。谷歌学者
M.Dehghani、H.Azarbonyad、J.Kamps和M.de Rijke。2019.学习在开放领域问题回答中转换、组合和推理。WSDM。谷歌学者数字图书馆
J.Devlin、M.-W.Chang、K.Lee和K.Toutanova。2018.BERT：深度双向变形金刚语言理解预培训。arXiv（2018）。谷歌学者
D.Diefenbach、V.López、K.Deep Singh和P.Maret。2018.基于知识库的问答系统核心技术：调查。知识。信息系统。，第55卷，第3卷（2018年）。谷歌学者数字图书馆
L.Dietz和B.Gamari，2017年。TREC CAR：用于复杂答案检索的数据集。在TREC中。谷歌学者
丁斌、余俊熙、王思旺、秦立群、张欣和林欣，2007年。在数据库中查找top-k最小成本连接树。在ICDE中。谷歌学者
L.Dong、F.Wei、M.Zhou和K.Xu。2015年，使用多列卷积神经网络在Freebase上进行问答。在ACL中。谷歌学者
R.G.Downey和M.R.Fellows。2013.参数化复杂性基础。斯普林格。谷歌学者数字图书馆
A.Fader、L.Zettlemoyer和O.Etzioni。2013年。ACL中开放式问题回答的释义驱动学习。谷歌学者
A.Fader、L.Zettlemoyer和O.Etzioni。2014年，针对精心策划和提取的知识库进行开放式问答。在KDD中。谷歌学者数字图书馆
D.Ferrucci等人，2012年。我是沃森。IBM Journal Special Issue on IBM Watson，Vol.56，3（2012）。谷歌学者
N.Garg、G.Konjevod和R.Ravi。群Steiner树问题的多对数近似算法。《算法》，第37卷，第1期（2000年）。谷歌学者数字图书馆
K.Gashteovski、R.Gemulla和L.Del Corro。2017年，MinIE:最小化公开信息提取中的事实。在EMNLP中。谷歌学者
A.Grycner和G.Weikum。2016年，POLY：从多语言句子中挖掘关系副短语。在EMNLP中。谷歌学者
我是盖伊。2018.语音搜索的特点：比较口语和键入的移动Web搜索查询。ACM事务处理。信息系统。(2018).谷歌学者数字图书馆
M.A.赫斯特。1992年，从大文本语料库中自动获取下位词。在COLING中。谷歌学者数字图书馆
J.Hoffart、M.A.Yosef、I.Bordino、H.Furstenau、M.Pinkal、M.Spaniol、B.Taneva、S.Thater和G.Weikum。2011.文本中命名实体的稳健消歧。在EMNLP中。谷歌学者数字图书馆
胡舒立（S.Hu）、邹立中（L.Zou）、余俊霞（J.X.Yu）、王浩（H.Wang）和赵德华（D.Zhao）。2018.通过知识图上的子图匹配回答自然语言问题。事务处理。了解。和Data Eng.，第30卷，第5卷（2018年）。谷歌学者
M.Iyyer、J.L.Boyd-Graber、L.M.B.Claudino、R.Socher和H.DauméIII，2014年。用于段落类事实问题回答的神经网络。在EMNLP中。谷歌学者
M.Joshi、E.Choi、D.S.Weld和L.Zettlemoyer。2017.TriviaQA：阅读理解的大规模远程监控挑战数据集。在ACL中。谷歌学者
M.Joshi、U.Sawant和S.Chakrabarti。2014.用于电信实体搜索查询的知识图和语料库驱动的分段和答案推理。在EMNLP中。谷歌学者
V.Kachoia、S.Pandit、S.Chakrabarti、S.Sudarshan、R.Desai和H.Karambelkar。2005.图形数据库关键字搜索的双向扩展。在VLDB中。谷歌学者数字图书馆
A.Kadry和L.Dietz。2017.支持通道检索的开放关系提取：优点和开放问题。在SIGIR中。谷歌学者数字图书馆
G.Kasneci、M.Ramanath、M.Sozio、F.M.Suchanek和G.Weikum。2009年STAR：关系图中的斯坦纳树近似。在ICDE中。谷歌学者数字图书馆
T.Khot、A.Sabharwal和P.Clark，2017年。使用开放式信息提取回答复杂问题。在ACL中。谷歌学者
C.Kwok、O.Etzioni和D.S.Weld。2001年，在网络上回答缩放问题。ACM事务处理。信息系统。(2001).谷歌学者数字图书馆
R.Li、L.Qin、J.X.Yu和R.Mao。2016。高效渐进的群组steiner树搜索。在SIGMOD中。谷歌学者数字图书馆
Y.Lin、H.Ji、Z.Liu和M.Sun。2018.去噪远程监督的开放域问答。在ACL中。谷歌学者
C.Manning、M.Surdeanu、J.Bauer、J.Finkel、S.Bethard和D.McClosky。2014.斯坦福CoreNLP自然语言处理工具包。在ACL中。谷歌学者
毛萨姆。2016年，开放式信息提取系统和下游应用程序。在IJCAI。谷歌学者数字图书馆
T.Mikolov、I.Sutskever、K.Chen、G.S.Corrado和J.Dean。2013.单词和短语的分布式表示及其组成。以NIPS为单位。谷歌学者数字图书馆
E.Pavlick、P.Rastogi、J.Ganitkevitch、B.Van Durme和C.Callison-Burch。2015.PPDB 2.0：更好的释义排名、细粒度隐含关系、单词嵌入和风格分类。在ACL中。谷歌学者
J.Pennington、R.Socher和C.D.Manning。2014年，GlobVe：单词表示的全球向量。在EMNLP中。谷歌学者
P.Rajpurkar、J.Zhang、K.Lopyrev和P.Liang。2016.SkuAD:100000多个机器理解文本的问题。在EMNLP中。谷歌学者
D.Ravichandran和E.Hovy。2002.学习问答系统的表层文本模式。在ACL中。谷歌学者数字图书馆
D.Savenkov和E.Agichtein。2016年，当知识库不够时：使用外部文本数据对知识库进行问答。在SIGIR中。谷歌学者数字图书馆
U.Sawant和S.Chakrabarti。2013.学习联合查询解释和响应排名。在WWW中。谷歌学者数字图书馆
V.I.Spitkovsky和A.X.Chang。2012.英语维基百科概念跨语言词典。在LREC中。3168--3175.谷歌学者
F.M.Suchanek、G.Kasneci和G.Weikum。2007.YAGO：语义知识的核心。在WWW中。谷歌学者数字图书馆
H.Sun、B.Dhingra、M.Zaheer、K.Mazaitis、R.Salakhutdinov和W.W.Cohen。2018年，利用知识库和文本的早期融合进行开放领域问答。在EMNLP中。谷歌学者
Sun、H.Ma、W.Yih、C.Tsai、J.Liu和M.Chang。2015.通过语义丰富进行开放域问答。在WWW中。谷歌学者数字图书馆
A.Talmor和J.Berant。2018年，网络作为回答复杂问题的知识库。在NAACL-HLT中。谷歌学者
C.Tan、F.Wei、Q.Zhou、N.Yang、B.Du、W.Lv和M.Zhou。2018.使用分层门控递归神经网络进行上下文软件应答句子选择。IEEE/ACM传输。《音频、语音和语言处理》，第26卷，第3期（2018年）。谷歌学者数字图书馆
C.Unger、L.Bühman、J.Lehman、A.N.Ngomo、D.Gerber和P.Cimiano。2012.基于模板的RDF数据问答。在WWW中。谷歌学者数字图书馆
C.Unger、A.Freitas和P.Cimiano。2014.关联数据问答导论。在推理Web中。谷歌学者
R.Usbeck、A.N.Ngomo、B.Haarmann、A.Krithara、M.Röder和G.Napolitano。2017年，第七届关联数据问答公开挑战赛（QALD-7）。程序中。SemWebEval公司。谷歌学者
E.M.沃里斯。2014年，抽样策略对推断措施的影响。在SIGIR中。谷歌学者数字图书馆
E.M.Voorhees和D.K.Harman。2005年，TREC：信息检索实验与评估。麻省理工学院出版社剑桥。谷歌学者数字图书馆
D.Vrandečić和M.Krötzsch。2014年，维基数据：一个免费的协作知识库。Commun公司。ACM，第57卷，第10卷（2014年）。谷歌学者数字图书馆
R.W.White、M.Richardson和W.T.Yih。2015.信息搜索任务中的问题与查询。在WWW.135--136中。谷歌学者数字图书馆
J.Wieting、M.Bansal、K.Gimpel和K.Livescu。2016.实现普遍释义句嵌入。在ICLR中。谷歌学者
K.Xu、S.Reddy、Y.Feng、S.Huang和D.Zhao。2016.通过关系提取和文本证据在freebase上进行问答。在ACL中。谷歌学者
M.Yahya、K.Berberich、S.Elbassuoni、M.Ramanath、V.Tresp和G.Weikum。2012.数据网络的自然语言问题。在EMNLP中。谷歌学者数字图书馆
M.Yahya、S.Whang、R.Gupta和A.Halevy。2014.ReNoun：名义属性的事实提取。在EMNLP中。谷歌学者
W.Yih、M.Chang、X.He和J.Gao。2015.通过分阶段查询图生成进行语义分析：使用知识库进行问题解答。在ACL中。谷歌学者
尹斌（P.Yin）、段南安（N.Duan）、高斌（B.Kao）、鲍建军（J.Bao）和周明珠（M.Zhou）。2015.在开放知识库上回答具有复杂语义约束的问题。在CIKM中。谷歌学者数字图书馆
J.X.Yu、L.Qin和L.Chang。2009年，数据库中的关键字搜索。摩根克莱普尔。谷歌学者数字图书馆
D.Ziegler、A.Abujabal、R.Saha Roy和G.Weikum。2017.使用答案类型预测的效率软件对合成问题的回答。在IJCNLP中。谷歌学者

索引术语

用拟知识图结合多文档证据回答复杂问题
1. 信息系统
  1. 信息检索
    1. 检索任务和目标
      1. 问题的回答

建议

知识图上复杂时间问题的求解
CIKM’21：第30届ACM信息与知识管理国际会议记录

基于知识图的问答（KG-QA）是信息检索中的一个重要课题。具有时间意图的问题是一类特殊的具有实际意义的问题，但在研究中还没有得到足够的重视。这项工作介绍了EXAQT，第一个端到端系统。。。
阅读更多信息
学习使用查询组合在知识库上回答复杂问题
CIKM’19：第28届ACM信息和知识管理国际会议记录

近年来，基于知识的问答（KB-QA）系统激增，该系统通过将用户提出的问题转换为知识库（KB）上的精确结构化查询，为用户提供清晰的答案。KB-QA的一个主要挑战是。。。
阅读更多信息
回答知识图上的复杂问题
知识科学、工程与管理
摘要
基于知识的问答主题( $KBQA公司$ )长期以来受到了广泛关注。已经开发了一系列技术，特别是简单的问题.回答复杂的问题，大多数现有方法应用。。。
阅读更多信息

登录选项

检查您是否可以通过登录凭据或您的机构访问本文。

完全访问权限

获取此出版物

发布于
SIGIR’19：第42届国际ACM SIGIR信息检索研究与开发会议记录
2019年7月
1512页
国际标准图书编号：9781450361729
DOI（操作界面）：10.1145/3331184
总主席：
本杰明·皮沃沃斯基
CNRS-法国索邦大学
,
Max骑士
法国中央研究院图卢兹大学
,
埃里克·高斯（Eric Gaussier）
法国CNRS格勒诺布尔阿尔卑斯大学
,
课程主席：
尤埃勒·马雷克
Amazon Research，以色列
,
聂建云
加拿大蒙特利尔大学
,
福尔克·斯科勒
澳大利亚皇家墨尔本理工大学
版权©2019 ACM
如果复制品不是为了盈利或商业利益而制作或分发的，并且复制品的第一页载有本通知和完整引文，则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人拥有的本作品组件的版权。允许用信用证进行摘要。要以其他方式复制或重新发布，在服务器上发布或重新发布到列表，需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]
赞助商
合作中
出版商
计算机协会
美国纽约州纽约市
出版历史
- 出版：2019年7月18日
权限
请求有关此文章的权限。
请求权限

检查更新
作者标记
复杂的问题
直接回答
组steiner树
网上答疑
限定符
- 研究论文
会议

接受率
19年12月纸张接受率84属于426提交，20%总体验收率792属于3,983提交，20%
更多
资金来源
其他指标
查看文章指标

文章指标
- 26
  引文总数
  查看引文
- 1,210
  总下载次数
- 下载次数（过去12个月）68
- 下载次数（最近6周）6
其他指标
查看作者指标
引用人
查看全部

PDF格式

以PDF文件查看或下载。

PDF格式

电子阅读器

使用eReader联机查看。

电子阅读器

用拟知识图结合多文档证据回答复杂问题

SIGIR’19：第42届国际ACM SIGIR信息检索研究与开发会议记录

摘要

补充材料

工具书类

引用人

索引术语

建议

知识图上复杂时间问题的求解

学习使用查询组合在知识库上回答复杂问题

回答知识图上的复杂问题

评论