跳到内容

ajesujoba/UNIQORN公司

文件夹和文件

姓名姓名
上次提交消息
上次提交日期

最新提交

 
 
 
 
 
 
 
 
 
 
 
 
 

存储库文件导航

UNIQORN:基于RDF知识图和自然语言文本的统一问答

说明

通过知识图和其他RDF数据进行问答已经得到了极大的改进,许多好的系统为自然语言问题或电报查询提供了清晰的答案。其中一些系统将文本源作为回答过程的附加证据,但无法单独计算文本中的答案。相反,来自IR和NLP社区的系统已经解决了文本上的QA问题,但这些系统几乎没有利用语义数据和知识。本文提出了第一个QA系统,它可以在统一的框架中无缝地在RDF数据集和文本语料库上运行,或者同时在两者上运行UNIQORN公司,通过使用微调BERT模型从RDF数据和/或文本语料库片段中检索与问题相关的三元组,实时构建上下文图。结果图通常很丰富,但噪音很大。UNIQORN公司使用Group Steiner Trees的高级图形算法处理此输入,该算法可以识别上下文图中的最佳候选答案。对具有多个实体和关系的复杂问题的几个基准的实验结果表明UNIQORN公司生成的结果与KG、文本语料库和异构源上的最新结果相当。基于图形的方法为完整的回答过程提供了用户可解释的证据。

本文中的一个运行示例是:问题:利奥获得奥斯卡奖的西部片导演?[答:亚历杭德罗·伊尼亚·里图]

UNIQORN千克

图1-输入KG的XG(q)示例。

尤尼科恩(Uniqorn)为利奥(Leo)获得奥斯卡奖的西方导演这一问题构建的背景图(XG)?锚是带有(部分)下划线标签的节点;答案是粗体的。橙色子图是组Steiner树。

有关更多信息,请联系:Soumajit Pramanik公司,杰苏霍巴·阿拉比,里希拉吉·萨哈·罗伊格哈德·威库姆

如果你使用我们的模型,请引用这篇论文

@文章{DBLP:journals/corr/abs-2108-08614,author={Soumajit Pramanik和Jesujoba Alabi和Rishiraj Saha Roy和格哈德·威库姆},title={{UNIQORN:}基于{RDF}知识图的统一问答和自然语言文本},日志={CoRR},体积={abs/2108.08614},年份={2021},url={https://arxiv.org/abs/1208.08614},eprinttype={arXiv},eprint={2108.08614},timestamp={2021年8月23日星期一14:07:13+0200},biburl={https://dblp.org/rec/journals/corr/abs-2108-08614.bib},bibsource={dblp计算机科学参考书目,网址:https://dblp.org}}

关于

未提供描述、网站或主题。

资源

星星

观察者

叉子

发布

未发布版本

包装

未发布包