国际标准协会 档案文件 2023年Interspeech
国际标准协会 档案文件 2023年Interspeech

FOOCTTS:为足球解说员生成具有声学环境的阿拉伯语语音

马萨·巴利(Massa Baali)、艾哈迈德·阿里(Ahmed M.Ali)

本文介绍了FOOCTTS,一种用于足球评论员的自动管道,它可以生成带有背景人群噪音的语音。应用程序从用户处获取文本,应用文本预处理,如元音化,然后是评论员的语音合成器。我们的产品线包括用于数据标记的阿拉伯语自动语音识别、CTC分割、用于匹配语音的转录元音化和微调TTS。我们的系统能够在足球评论员有限的15分钟内通过其声学环境生成语音。我们的原型是通用的,可以很容易地应用于不同的领域和语言。