电气工程和系统科学>音频和语音处理
标题: Jam-ALT:格式化软件歌词转录基准
摘要: 当前的自动歌词转录(ALT)基准只关注单词内容,而忽略了书写歌词的细微差别,包括格式和标点符号,这可能导致与音乐家和作曲家的创意产品以及听众的体验不一致。 例如,换行符在传达有关节奏、情感强调、韵律和高级结构的信息方面很重要。 为了解决这个问题,我们引入了Jam-ALT,一个基于JamendoLyrics数据集的新歌词转录基准。 我们的贡献是双重的。 首先,对成绩单进行全面修订,特别针对ALT评估,遵循新创建的注释指南,该指南统一了音乐行业的指南,涵盖标点符号、换行符、拼写、背景人声和非单词发音等方面。 其次,与传统的单词错误率不同,我们设计了一套评估指标来捕捉这种现象。 我们希望,拟议的基准有助于ALT任务,能够对转录系统进行更精确和可靠的评估,并增强用户在歌词应用程序中的体验,例如用于现场字幕或卡拉ok的字幕渲染。