OpenBookQA（OBQA）

Mihaylov等人于年介绍一套盔甲能导电吗？一种新的开卷问答数据集

OpenBookQA是一种新的问答数据集，它是在开卷考试之后建模的，用于评估人类对某一主题的理解。它由5957个多项选择基本科学问题组成（4957题列，500题，500测试），探究对1326个核心科学事实的小“书”的理解以及这些事实在新情况下的应用。对于培训，数据集包括从每个问题到其设计要探究的核心科学事实的映射。回答OpenBookQA问题需要额外的广泛常识，这本书中没有包含。根据设计，基于检索的算法和单词共现算法都无法正确回答这些问题。此外，该数据集还包括5167个众包公共知识事实的集合，以及一个扩展版的训练/开发/测试问题，其中每个问题都与其原始核心事实、人类准确性分数、清晰度分数和匿名众工ID相关联。

资料来源：https://allenai.org/data/open-book-qa

主页

基准

添加新结果  链接现有基准

趋势	任务	数据集变量	最佳模型	纸类	代码
	问题解答	OpenBookQA	GPT-4+知识库
	问题解答	OBQA公司	法兰137B

论文

纸类	代码	结果	日期	星星

数据集加载器

添加  删除

拥抱面孔/数据集（openbookqa）

18,623

拥抱面孔/数据集（openbookqa）

18,623

卡格尔/卡格尔阿皮

5,979

张量流/数据集

4217年

任务

问题解答

类似数据集

威诺格兰德

HellaSwag公司

PIQA公司

ARC（AI2推理挑战）

资料来源：https://arxiv.org/pdf/1809.02789.pdf.

用法

OpenBookQA（OBQA）

基准 编辑 添加新结果 链接现有基准

论文

数据集加载器 编辑 添加 删除

任务 编辑

类似数据集

威诺格兰德

HellaSwag公司

PIQA公司

ARC（AI2推理挑战）

用法

许可证 编辑

模式 编辑

语言文字 编辑

基准

添加新结果链接现有基准

数据集加载器

添加删除

任务

许可证

模式

语言文字