跳到主要内容
10.1145/3331184.3331252高级会议文章/章节视图摘要出版物页面红外会议记录会议集合
研究论文

用拟知识图结合多文档证据回答复杂问题

出版:2019年7月18日出版历史

摘要

对于基于文本的QA来说,直接回答涉及多个实体和关系的问题是一个挑战。当只能通过连接多个文档中的证据才能找到答案时,这个问题最为突出。Curated knowledge graphs(KG)可能会给出很好的答案,但其固有的不完整性和潜在的陈旧性限制了它。本文提出了一种通过计算不同文档的部分结果的相似性连接来直接从文本源中实时回答复杂问题的方法QUEST。我们的方法是完全无监督的,避免了训练数据瓶颈,能够应对用户问题中快速发展的特定主题和公式化风格。QUEST构建了一个带有节点和边缘权重的噪声准KG,由动态检索的实体名称和关系短语组成。它用类型和语义对齐来扩充该图,并通过组Steiner树的算法计算最佳答案。我们根据复杂问题的基准对QUEST进行了评估,并表明它大大优于最先进的基准。

跳过补充材料部分

补充材料

城市1-14h30-d1.mp4

英里4

456.4 MB

工具书类

  1. A.Abujabal、M.Yahya、M.Riedewald和G.Weikum。2017.知识图问答的自动模板生成。在WWW中。谷歌学者谷歌学者数字图书馆数字图书馆
  2. E.Agichtein、D.Carmel、D.Pelleg、Y.Pinter和D.Harman。2015年,TREC 2015 LiveQA跟踪概述。在TREC中。谷歌学者谷歌学者
  3. G.Angeli、M.J.J.Premkumar和C.D.Manning。2015.利用语言结构进行开放域信息提取。在ACL中。谷歌学者谷歌学者
  4. S.Auer、C.Bizer、G.Kobilarov、J.Lehmann、R.Cyganiak和Z.Ives。2007年,DBpedia:开放数据网络的核心。在语义网中。斯普林格。谷歌学者谷歌学者数字图书馆数字图书馆
  5. J.Bao、N.Duan、Z.Yan、M.Zhou和T.Zhao。2016。基于约束的知识图问答。在COLING中。谷歌学者谷歌学者
  6. H.巴斯特和E.奥斯曼。2015年,在Freebase上更准确地回答问题。在CIKM中。谷歌学者谷歌学者数字图书馆数字图书馆
  7. J.Berant、A.Chou、R.Frostig和P.Liang。2013.基于Freebase的问答对语义分析。在ACL中。谷歌学者谷歌学者
  8. G.Bhalotia、A.Hulgeri、C.Nakhe、S.Chakrabarti和S.Sudarshan。2002.使用BANKS在数据库中进行关键字搜索和浏览。在ICDE中。谷歌学者谷歌学者数字图书馆数字图书馆
  9. K.Bollacker、C.Evans、P.Paritosh、T.Sturge和J.Taylor。2008.Freebase:一个合作创建的图形数据库,用于构建人类知识。在SIGMOD中。谷歌学者谷歌学者数字图书馆数字图书馆
  10. A.Bordes、N.Usunier、S.Chopra和J.Weston。2015年,使用存储网络进行大规模简单问答。在arXiv。谷歌学者谷歌学者
  11. Q.Cai和A.Yates。2013.通过模式匹配和词汇扩展进行大规模语义分析。在ACL中。谷歌学者谷歌学者
  12. D.Chen、A.Fisch、J.Weston和A.Bordes。2017.阅读维基百科回答开放域问题。在ACL中。谷歌学者谷歌学者
  13. J.Coffman和A.C.Weaver。2014.关系关键字搜索技术的实证性能评估。在TKDE中。谷歌学者谷歌学者数字图书馆数字图书馆
  14. L.Del Corro和R.Gemulla。2013.ClausIE:基于子句的开放信息提取。在WWW中。谷歌学者谷歌学者数字图书馆数字图书馆
  15. R.Das、M.Zaheer、S.Reddy和A.McCallum。2017年,使用通用模式和记忆网络对知识库和文本进行问答。在ACL中。谷歌学者谷歌学者
  16. M.Dehghani、H.Azarbonyad、J.Kamps和M.de Rijke。2019.学习在开放领域问题回答中转换、组合和推理。WSDM。谷歌学者谷歌学者数字图书馆数字图书馆
  17. J.Devlin、M.-W.Chang、K.Lee和K.Toutanova。2018.BERT:深度双向变形金刚语言理解预培训。arXiv(2018)。谷歌学者谷歌学者
  18. D.Diefenbach、V.López、K.Deep Singh和P.Maret。2018.基于知识库的问答系统核心技术:调查。知识。信息系统。,第55卷,第3卷(2018年)。谷歌学者谷歌学者数字图书馆数字图书馆
  19. L.Dietz和B.Gamari,2017年。TREC CAR:用于复杂答案检索的数据集。在TREC中。谷歌学者谷歌学者
  20. 丁斌、余俊熙、王思旺、秦立群、张欣和林欣,2007年。在数据库中查找top-k最小成本连接树。在ICDE中。谷歌学者谷歌学者
  21. L.Dong、F.Wei、M.Zhou和K.Xu。2015年,使用多列卷积神经网络在Freebase上进行问答。在ACL中。谷歌学者谷歌学者
  22. R.G.Downey和M.R.Fellows。2013.参数化复杂性基础。斯普林格。谷歌学者谷歌学者数字图书馆数字图书馆
  23. A.Fader、L.Zettlemoyer和O.Etzioni。2013年。ACL中开放式问题回答的释义驱动学习。谷歌学者谷歌学者
  24. A.Fader、L.Zettlemoyer和O.Etzioni。2014年,针对精心策划和提取的知识库进行开放式问答。在KDD中。谷歌学者谷歌学者数字图书馆数字图书馆
  25. D.Ferrucci等人,2012年。我是沃森。IBM Journal Special Issue on IBM Watson,Vol.56,3(2012)。谷歌学者谷歌学者
  26. N.Garg、G.Konjevod和R.Ravi。群Steiner树问题的多对数近似算法。《算法》,第37卷,第1期(2000年)。谷歌学者谷歌学者数字图书馆数字图书馆
  27. K.Gashteovski、R.Gemulla和L.Del Corro。2017年,MinIE:最小化公开信息提取中的事实。在EMNLP中。谷歌学者谷歌学者
  28. A.Grycner和G.Weikum。2016年,POLY:从多语言句子中挖掘关系副短语。在EMNLP中。谷歌学者谷歌学者
  29. 我是盖伊。2018.语音搜索的特点:比较口语和键入的移动Web搜索查询。ACM事务处理。信息系统。(2018).谷歌学者谷歌学者数字图书馆数字图书馆
  30. M.A.赫斯特。1992年,从大文本语料库中自动获取下位词。在COLING中。谷歌学者谷歌学者数字图书馆数字图书馆
  31. J.Hoffart、M.A.Yosef、I.Bordino、H.Furstenau、M.Pinkal、M.Spaniol、B.Taneva、S.Thater和G.Weikum。2011.文本中命名实体的稳健消歧。在EMNLP中。谷歌学者谷歌学者数字图书馆数字图书馆
  32. 胡舒立(S.Hu)、邹立中(L.Zou)、余俊霞(J.X.Yu)、王浩(H.Wang)和赵德华(D.Zhao)。2018.通过知识图上的子图匹配回答自然语言问题。事务处理。了解。和Data Eng.,第30卷,第5卷(2018年)。谷歌学者谷歌学者
  33. M.Iyyer、J.L.Boyd-Graber、L.M.B.Claudino、R.Socher和H.DauméIII,2014年。用于段落类事实问题回答的神经网络。在EMNLP中。谷歌学者谷歌学者
  34. M.Joshi、E.Choi、D.S.Weld和L.Zettlemoyer。2017.TriviaQA:阅读理解的大规模远程监控挑战数据集。在ACL中。谷歌学者谷歌学者
  35. M.Joshi、U.Sawant和S.Chakrabarti。2014.用于电信实体搜索查询的知识图和语料库驱动的分段和答案推理。在EMNLP中。谷歌学者谷歌学者
  36. V.Kachoia、S.Pandit、S.Chakrabarti、S.Sudarshan、R.Desai和H.Karambelkar。2005.图形数据库关键字搜索的双向扩展。在VLDB中。谷歌学者谷歌学者数字图书馆数字图书馆
  37. A.Kadry和L.Dietz。2017.支持通道检索的开放关系提取:优点和开放问题。在SIGIR中。谷歌学者谷歌学者数字图书馆数字图书馆
  38. G.Kasneci、M.Ramanath、M.Sozio、F.M.Suchanek和G.Weikum。2009年STAR:关系图中的斯坦纳树近似。在ICDE中。谷歌学者谷歌学者数字图书馆数字图书馆
  39. T.Khot、A.Sabharwal和P.Clark,2017年。使用开放式信息提取回答复杂问题。在ACL中。谷歌学者谷歌学者
  40. C.Kwok、O.Etzioni和D.S.Weld。2001年,在网络上回答缩放问题。ACM事务处理。信息系统。(2001).谷歌学者谷歌学者数字图书馆数字图书馆
  41. R.Li、L.Qin、J.X.Yu和R.Mao。2016。高效渐进的群组steiner树搜索。在SIGMOD中。谷歌学者谷歌学者数字图书馆数字图书馆
  42. Y.Lin、H.Ji、Z.Liu和M.Sun。2018.去噪远程监督的开放域问答。在ACL中。谷歌学者谷歌学者
  43. C.Manning、M.Surdeanu、J.Bauer、J.Finkel、S.Bethard和D.McClosky。2014.斯坦福CoreNLP自然语言处理工具包。在ACL中。谷歌学者谷歌学者
  44. 毛萨姆。2016年,开放式信息提取系统和下游应用程序。在IJCAI。谷歌学者谷歌学者数字图书馆数字图书馆
  45. T.Mikolov、I.Sutskever、K.Chen、G.S.Corrado和J.Dean。2013.单词和短语的分布式表示及其组成。以NIPS为单位。谷歌学者谷歌学者数字图书馆数字图书馆
  46. E.Pavlick、P.Rastogi、J.Ganitkevitch、B.Van Durme和C.Callison-Burch。2015.PPDB 2.0:更好的释义排名、细粒度隐含关系、单词嵌入和风格分类。在ACL中。谷歌学者谷歌学者
  47. J.Pennington、R.Socher和C.D.Manning。2014年,GlobVe:单词表示的全球向量。在EMNLP中。谷歌学者谷歌学者
  48. P.Rajpurkar、J.Zhang、K.Lopyrev和P.Liang。2016.SkuAD:100000多个机器理解文本的问题。在EMNLP中。谷歌学者谷歌学者
  49. D.Ravichandran和E.Hovy。2002.学习问答系统的表层文本模式。在ACL中。谷歌学者谷歌学者数字图书馆数字图书馆
  50. D.Savenkov和E.Agichtein。2016年,当知识库不够时:使用外部文本数据对知识库进行问答。在SIGIR中。谷歌学者谷歌学者数字图书馆数字图书馆
  51. U.Sawant和S.Chakrabarti。2013.学习联合查询解释和响应排名。在WWW中。谷歌学者谷歌学者数字图书馆数字图书馆
  52. V.I.Spitkovsky和A.X.Chang。2012.英语维基百科概念跨语言词典。在LREC中。3168--3175.谷歌学者谷歌学者
  53. F.M.Suchanek、G.Kasneci和G.Weikum。2007.YAGO:语义知识的核心。在WWW中。谷歌学者谷歌学者数字图书馆数字图书馆
  54. H.Sun、B.Dhingra、M.Zaheer、K.Mazaitis、R.Salakhutdinov和W.W.Cohen。2018年,利用知识库和文本的早期融合进行开放领域问答。在EMNLP中。谷歌学者谷歌学者
  55. Sun、H.Ma、W.Yih、C.Tsai、J.Liu和M.Chang。2015.通过语义丰富进行开放域问答。在WWW中。谷歌学者谷歌学者数字图书馆数字图书馆
  56. A.Talmor和J.Berant。2018年,网络作为回答复杂问题的知识库。在NAACL-HLT中。谷歌学者谷歌学者
  57. C.Tan、F.Wei、Q.Zhou、N.Yang、B.Du、W.Lv和M.Zhou。2018.使用分层门控递归神经网络进行上下文软件应答句子选择。IEEE/ACM传输。《音频、语音和语言处理》,第26卷,第3期(2018年)。谷歌学者谷歌学者数字图书馆数字图书馆
  58. C.Unger、L.Bühman、J.Lehman、A.N.Ngomo、D.Gerber和P.Cimiano。2012.基于模板的RDF数据问答。在WWW中。谷歌学者谷歌学者数字图书馆数字图书馆
  59. C.Unger、A.Freitas和P.Cimiano。2014.关联数据问答导论。在推理Web中。谷歌学者谷歌学者
  60. R.Usbeck、A.N.Ngomo、B.Haarmann、A.Krithara、M.Röder和G.Napolitano。2017年,第七届关联数据问答公开挑战赛(QALD-7)。程序中。SemWebEval公司。谷歌学者谷歌学者
  61. E.M.沃里斯。2014年,抽样策略对推断措施的影响。在SIGIR中。谷歌学者谷歌学者数字图书馆数字图书馆
  62. E.M.Voorhees和D.K.Harman。2005年,TREC:信息检索实验与评估。麻省理工学院出版社剑桥。谷歌学者谷歌学者数字图书馆数字图书馆
  63. D.Vrandečić和M.Krötzsch。2014年,维基数据:一个免费的协作知识库。Commun公司。ACM,第57卷,第10卷(2014年)。谷歌学者谷歌学者数字图书馆数字图书馆
  64. R.W.White、M.Richardson和W.T.Yih。2015.信息搜索任务中的问题与查询。在WWW.135--136中。谷歌学者谷歌学者数字图书馆数字图书馆
  65. J.Wieting、M.Bansal、K.Gimpel和K.Livescu。2016.实现普遍释义句嵌入。在ICLR中。谷歌学者谷歌学者
  66. K.Xu、S.Reddy、Y.Feng、S.Huang和D.Zhao。2016.通过关系提取和文本证据在freebase上进行问答。在ACL中。谷歌学者谷歌学者
  67. M.Yahya、K.Berberich、S.Elbassuoni、M.Ramanath、V.Tresp和G.Weikum。2012.数据网络的自然语言问题。在EMNLP中。谷歌学者谷歌学者数字图书馆数字图书馆
  68. M.Yahya、S.Whang、R.Gupta和A.Halevy。2014.ReNoun:名义属性的事实提取。在EMNLP中。谷歌学者谷歌学者
  69. W.Yih、M.Chang、X.He和J.Gao。2015.通过分阶段查询图生成进行语义分析:使用知识库进行问题解答。在ACL中。谷歌学者谷歌学者
  70. 尹斌(P.Yin)、段南安(N.Duan)、高斌(B.Kao)、鲍建军(J.Bao)和周明珠(M.Zhou)。2015.在开放知识库上回答具有复杂语义约束的问题。在CIKM中。谷歌学者谷歌学者数字图书馆数字图书馆
  71. J.X.Yu、L.Qin和L.Chang。2009年,数据库中的关键字搜索。摩根克莱普尔。谷歌学者谷歌学者数字图书馆数字图书馆
  72. D.Ziegler、A.Abujabal、R.Saha Roy和G.Weikum。2017.使用答案类型预测的效率软件对合成问题的回答。在IJCNLP中。谷歌学者谷歌学者

索引术语

  1. 用拟知识图结合多文档证据回答复杂问题

    建议

    评论

    登录选项

    检查您是否可以通过登录凭据或您的机构访问本文。

    登录

    完全访问权限

    • 发布于

      封面图片ACM会议
      SIGIR’19:第42届国际ACM SIGIR信息检索研究与开发会议记录
      2019年7月
      1512页
      国际标准图书编号:9781450361729
      DOI(操作界面):10.1145/3331184

      版权©2019 ACM

      如果复制品不是为了盈利或商业利益而制作或分发的,并且复制品的第一页载有本通知和完整引文,则允许免费制作本作品的全部或部分数字或硬拷贝以供个人或课堂使用。必须尊重ACM以外的其他人拥有的本作品组件的版权。允许用信用证进行摘要。要以其他方式复制或重新发布,在服务器上发布或重新发布到列表,需要事先获得特定许可和/或付费。从请求权限[电子邮件保护]

      出版商

      计算机协会

      美国纽约州纽约市

      出版历史

      • 出版:2019年7月18日

      权限

      请求有关此文章的权限。

      请求权限

      检查更新

      限定符

      • 研究论文

      接受率

      19年12月纸张接受率84属于426提交,20%总体验收率792属于3,983提交,20%

    PDF格式

    以PDF文件查看或下载。

    PDF格式

    电子阅读器

    使用eReader联机查看。

    电子阅读器