计算机科学>计算与语言
标题: FrenchMedMCQA:一个适用于医学领域的法语多选问答数据集
摘要: 本文介绍了FrenchMedMCQA,这是第一个公开可用的法语多选项问答(MCQA)数据集,用于医学领域。 它由3105道来自法国药学医学专业文凭真实考试的问题组成,混合了单一和多重答案。 数据集的每个实例都包含一个标识符、一个问题、五个可能的答案及其手动更正。 我们还提出了第一个基线模型来自动处理这个MCQA任务,以便报告当前的性能并突出任务的难度。 对结果的详细分析表明,有必要使表征适应医学领域或MCQA任务:在我们的案例中,尽管FrenchMedMCQA是法语的,但英语专业模型比通用法语模型产生更好的结果。 网上有语料库、模型和工具。