小米人工智能实验室的语音翻译系统IWSLT公司2023离线任务、同时任务和演讲任务

黄武威,刘梦歌,向丽,盐芷田,杨凤玉,文章(Wen Zhang),建銮,Bin Wang(王斌),余杭郭,苏劲松


摘要
本系统描述文件将小米人工智能实验室提交的系统介绍给IWSLT 2023评估活动的三个轨道,即离线语音翻译(offline-ST)轨道、离线语音转换(offline-S2ST)轨道和同步语音翻译(Simul-ST)轨。我们提交的所有这三首曲目都只涉及英汉语言指导。我们的英汉语音翻译系统是以大规模预训练模型为基础构建的。具体来说,我们为各种下游语音翻译任务微调这些模型的相应组件。此外,我们还实现了几种常用的技术,如数据过滤、数据增强、语音分割和模型集成,以提高系统的整体性能。大量实验表明,我们的系统在自动评估指标方面比强基线系统有了显著改进。
选集ID:
2023.iwslt-1.39年
体积:
第20届国际口语翻译大会(IWSLT 2023)会议记录
月份:
七月
年份:
2023
地址:
加拿大多伦多(现场和在线)
编辑:
伊丽莎白·塞尔斯基,马塞洛·费德里科,海洋木瓜
地点:
IWSLT公司
SIG公司:
SIGSLT公司
出版商:
计算语言学协会
注:
页:
411–419
语言:
网址:
https://aclantology.org/2023.iwslt-1.39
内政部:
10.18653/v1/2023.iwslt-1.39
比比键:
引用(ACL):
黄武伟、刘孟戈、李翔、田艳芝、杨凤玉、张文、建銮、王斌、郭余杭和苏劲松。2023年。小米人工智能实验室针对IWSLT 2023离线任务、同时任务和语音到语音任务的语音翻译系统.英寸第20届国际口语翻译大会(IWSLT 2023)会议记录,第411-419页,加拿大多伦多(同人和在线)。计算语言学协会。
引用(非正式):
小米人工智能实验室针对IWSLT 2023离线任务、同时任务和语音转换任务的语音翻译系统(Huang等人,IWSLT 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.iwslt-1.39.pdf