数据集集合

所有项目
所有年份
查看59个数据集中的1-10个
  • 原子2020

    日常常识推理图集,通过1.33米推理知识的文本描述组织起来。马赛克•2021我们展示了ATOMIC 2020,一个常识知识图,包含了关于实体和事件的每天133万个推理知识元组。ATOMIC 2020代表了一个大规模的文本描述常识库,对人类日常生活中的社会和物理方面进行了编码,旨在对当前语言模型中编码的常识知识进行补充。原子2020引入了23种常识关系类型。它们大致可分为三类:9种社会交往常识关系、7种实体实体常识关系和7种以事件为中心的常识关系。
  • 原子:If-Then推理的机器常识图集

    日常常识推理图集,通过877k推理知识的文本描述进行组织。马赛克•2021我们提出了原子,一个日常常识推理的地图集,通过877k文本描述的推理知识。与以分类知识为中心的现有资源相比,ATOMIC关注的是按类型化if-then与变量的关系组织的推理知识(例如,“如果X对Y表示称赞,那么Y可能会返回称赞”)。
  • 彩虹:常识推理基准

    一个跨越社会和物理常识的常识推理基准马赛克•2021彩虹是一个普遍的常识推理基准,跨越了社会和物理常识。Rainbow汇集了6个现有的常识推理任务:aNLI、Cosmos QA、HellaSWAG、Physical IQa、Social IQa和WinoGrande。建模人员面临的挑战是开发能够捕获世界知识的技术,以帮助解决这一系列广泛的任务。
  • 顾忌:Subreddit语料库,要求理解生活中类似伦理的原则

    预测社区对现实生活轶事的伦理判断的语料库和基准马赛克•2021顾忌是研究描述性机器伦理或机器理解人们道德判断能力的语料库和基准。scrubles提供了两个数据集:轶事和困境。这些轶事收集了现实生活中关于他们的伦理判断的经验,而困境则呈现了一对对简单的行动和众包的判断,而这些判断是不道德的。
  • 战略QA

    2780个隐式多跳推理问题以色列,问题理解,亚里士多德•2021StrategyQA是一个问答基准,关注于开放领域问题,其中所需的推理步骤隐含在问题中,并且应该使用策略进行推断。StrategyQA包括2780个示例,每个示例由一个策略问题、其分解和证据段落组成。
  • 校对员

    规则制定者更新了500多个规则库的问题和答案。亚里士多德2020这些数据集伴随着论文“校对者:在自然语言上生成暗示、证明和溯因性陈述”。它们包含了更新的规则制定者风格的数据集,包含了超过自然语言规则库的500k个问题、答案和证明,用于表明变形金刚可以模拟语言表达的规则的推理,包括证明生成。它包括使用封闭和开放世界语义的变体。证明包括中间结论。额外的注释提供数据来训练迭代校对模型,以及使不确定陈述变得确定的溯因推理。
  • 规则制定者:变形金刚是语言的软推理者

    用来教变形金刚推理的数据集亚里士多德2020变形金刚能被训练成对语言表达的规则进行推理(或模仿推理)吗?在相关的论文和演示中,我们提供了证据证明他们可以。我们的模型,我们称之为规则制定者,是根据综合规则库的数据集和这里提供的派生结论进行训练的。由此产生的模型首次证明了这种语言软推理确实是可以学习的。
  • 从任务描述中零距离学习

    ZEST是一个基准,用于将零快照泛化到看不见的NLP任务,在1251个不同的任务中有25K个标记实例。AI2欧文,马赛克,艾伦尼普•2020ZEST测试NLP系统是否能够以零触发的方式执行看不见的任务,给出任务的自然语言描述。它是我们提出的“从任务描述中学习”框架的一个实例。任务包括分类、类型化实体提取和关系提取,每个任务都有20个不同的注释(输入、输出)示例。ZEST的结构使我们能够系统地测试模型是否可以用五种不同的方式进行概括。
  • 打开PI

    33K州从810个程序性、真实的段落中改变了4050个句子亚里士多德,马赛克•2020openpi是第一个使用无限制(Open)词汇表跟踪来自任意域的过程文本中的状态变化的数据集。我们的解决方案是一个新的任务公式,其中只提供文本,从中为每个步骤生成一组状态更改(实体、属性、之前、之后),其中实体、属性和值都必须从开放词汇表中进行预测。
  • 真实毒性提示

    一个由10万个句子片段组成的数据集,供研究人员进一步解决模型中神经毒性退化的风险。马赛克•2020一个由10万个句子片段组成的数据集,供研究人员进一步解决模型中神经毒性退化的风险。
所有项目
所有年份