我们为这个答案预测任务提供了两个数据集,一个使用DBpedia本体,另一个使用Wikidata本体。两者都遵循如下所示的结构。
每个问题都有一个(a)问题id,(b)自然语言中的问题文本,(c)答案类别(“resource”/“literal”/“boolean”),以及(d)答案类型。
如果类别是“资源”,那么答案类型是DBpedia本体或Wikidata本体中的本体类。如果类别为“literal”,则答案类型为“number”、“date”或“string”。“布尔”答案类型。如果类别为“boolean”,则答案类型始终为“boo布尔”。
[{“id”:“dbpedia_1”,“问题”:“阿曼达·雷丁指导的体操运动员是谁?”,“category”:“资源”,“type”:[“dbo:Gymnast”,“dbo:运动员”,“db2o:Person”,“dmo:Agent”]},{“id”:“dbpedia_2”,“问题”:“神奇女郎有多少超能力?”,“category”:“literal”,“类型”:[“数字”]}{“id”:“dbpedia_3”,“问题”:“玛格丽特·米德什么时候和格雷戈里·贝特森结婚的?”,“category”:“literal”,“类型”:[“日期”]},{“id”:“dbpedia_4”,“问题”:“阿塞拜疆是欧洲围棋联合会的成员吗?”,“category”:“boolean”,“type”:[“boolean”]}]
任务2:关系预测(SMART2022-RL)
与AT类似,我们为关系预测任务提供了两个数据集,一个使用DBpedia本体,另一个使用Wikidata本体。两者都遵循如下所示的结构。
每个问题都有一个(a)问题id,(b)自然语言中的问题文本,(c)关系块列表(涉及n个关系的多跳问题的n个块)。每个关系块可以有多个可互换关系。
我们还提供了数据集中使用的所有关系的受限词汇表(训练集和测试集)。
[{“id”:“smart-2022-rl-dbpedia-0”“问题”:“理查德·斯普里格·斯图尔特出生在哪里?”,“关系”:[[“dbo:出生地”]]}, {“id”:“smart-2022-rl-dbpedia-1”,“问题”:“电影《穿靴子的猫》的制片人获得了哪些奖项?”,“关系”:[[“dbo:生产商”],[“dbo:奖项”]]},{“id”:“smart-2022-rl-dbpedia-2”“问题”:“说出加州的一所大学”,“关系”:[[“dbo:locatedInArea”,“dbo:城市”]}]
任务3:实体链接(SMART2022-EL)
与前两个任务类似,我们为实体链接任务提供了两个数据集,一个使用DBpedia本体,另一个使用Wikidata知识图。两者都遵循如下所示的结构。
每个问题都有一个(a)问题id,(b)自然语言的问题文本,(c)实体列表
[{“id”:“smart-2022-rl-dbpedia-0”“问题”:“理查德·斯普里格·斯图尔特出生在哪里?”,“实体”:[“dbr:Richard_Sprigg_Steuart”]}, {“id”:“smart-2022-rl-dbpedia-1”,“问题”:“电影《穿靴子的猫》的制片人获得了哪些奖项?”,“实体”:[dbr:Puss_in_Boots_(2011_film)]}{“id”:“smart-2022-rl-dbpedia-2”“问题”:“说出加州的一所大学”,“实体”:[dbr:加利福尼亚]}]