根据基准列表推断出一些任务。
基准测试部分列出了使用给定数据集或它的变体。我们使用变量来区分评估结果同一数据集的版本略有不同。例如,ImageNet 32⨉32和ImageNet 64⨉64是ImageNet数据集的变体。
这个菲格数据集是一个实体识别数据集,其中实体使用细粒度系统112标记进行标记,例如个人/医生,艺术/写作和建筑物/酒店。这些标签来自Freebase类型。训练集由维基百科文章组成,这些文章使用远程监督方法自动注释,该方法利用锚链接中编码的信息。测试集是手动注释的。