校对作者

亚里士多德•2020
这些数据集与论文“校对作者:在自然语言上生成含意、证据和拐骗性陈述”一起出现。它们包含更新的RuleTaker风格的数据集,其中包含自然语言规则库上的50万个问题、答案和证明,用于表明Transformers可以模拟语言表达规则的推理,包括证明生成。它包括使用封闭和开放世界语义的变体。证据包括中间结论。额外的注释提供数据来训练迭代的Proof-Writer模型,以及诱因推理来确定不确定的语句。
许可证: 抄送人

点击数据集的“下载”或“查看网站”,尝试现场演示!

ProofWriter数据集包含许多用英语表示的事实和规则的小规则库。每个规则库也有一组问题(英语陈述),这些问题可以通过各种深度的证明来证明是真是假,或者答案是“未知”(在开放世界环境下,OWA)或假设是否定的(在封闭世界环境中,CWA)。

数据集包括带有中间结论的完整证明,模型可以尝试重现这些结论。请参阅自述文件了解更多详细信息。

数据集支持各种任务:

  • 给定规则库+问题,什么是答案+证据(w/中间产物)?
  • 给定规则库,所有可证明的含义是什么?
  • 给定规则库+没有证据的问题,可以添加什么单一事实来证明问题的真实性?

下面是depth-2数据集D2(OWA)的一个简单示例:

规则库:

这头牛很大。母牛需要狗。狗看见了兔子。兔子追赶奶牛。兔子追狗。三胞胎6:兔子很大。兔子看见了狗。规则一:如果奶牛是蓝色的,奶牛需要兔子,那么奶牛需要狗。规则二:如果奶牛追狗,奶牛就会看到兔子。规则三:如果东西很大,它就会追狗。

带答案和证据的问题:

问题:奶牛看到兔子了吗?答案:true证明:(((triple1)->(rule3%int2))->(规则2%int1);with int1=奶牛看到兔子;int2=母牛追狗。

产生所有影响(在这种情况下只有2个,在D5理论中可能高达21个):

所有暗示:牛追狗。奶牛看到了兔子。

利用诱拐找到一个缺失的事实,这将使事情变得真实:

问题是:狗追狗。遗漏事实:这只狗很大。(表示三个M)证明:(tripleM)->规则3

作者

Oyvind Tafjord、Bhavana Dalvi Mishra、Peter Clark