计算机科学>计算与语言
标题: XTREME-S:评估跨语言语音表征
摘要: 我们引入了XTREME-S,这是一个新的基准,用于评估多种语言的通用跨语言语音表示。 XTREME-S涵盖四个任务系列:语音识别、分类、语音到文本的翻译和检索。 XTREME-S涵盖10+个语言家族、3个不同领域和4个任务家族的102种语言,旨在简化多语言语音表征评估,并促进“通用”语音表征学习的研究。 本文描述了新的基准测试,并在所有下游任务上使用XLS-R和mSLAM建立了第一个仅讲话和讲话文本基线。 我们鼓励设计选择并详细说明如何使用基准 此https URL .