NVIDIA公司 N个e(电子)M(M)o离线语音翻译系统IWSLT公司2023

Oleksii Hrinchuk公司,弗拉基米尔·巴塔耶夫,伊芙琳娜·巴赫图利纳,鲍里斯·金斯伯格


摘要
本文概述了NVIDIA NeMo为IWSLT 2023离线语音翻译任务开发的语音翻译系统。今年,我们重点开发了端到端系统,该系统利用预处理模型和合成数据来缓解直接语音翻译数据稀缺的问题。在接受IWSLT 2022约束数据的培训后,我们最好的En->De端到端模型在IWSLT 2010-2020年的7个测试集上取得了31个BLEU的平均分数,比去年的级联(28.4)和端到端(25.7)提交的数据有所提高。当根据IWSLT 2023约束数据进行训练时,平均得分降至29.5 BLEU。
选集ID:
2023.iwslt-1.42年
体积:
第20届国际口语翻译大会(IWSLT 2023)会议记录
月份:
七月
年份:
2023
地址:
加拿大多伦多(现场和在线)
编辑:
伊丽莎白·塞尔斯基,马塞洛·费德里科,海洋木瓜
地点:
IWSLT公司
SIG公司:
SIGSLT公司
出版商:
计算语言学协会
注:
页:
442–448
语言:
网址:
https://acl选集.org/2023.iwslt-1.42
内政部:
10.18653/v1/2023.iwslt-1.42
比比键:
引用(ACL):
Oleksii Hrinchuk、Vladimir Bataev、Evelina Bakhturina和Boris Ginsburg,2023年。适用于IWSLT 2023的NVIDIA NeMo离线语音翻译系统.英寸第20届国际口语翻译大会(IWSLT 2023)会议记录,第442-448页,加拿大多伦多(同人和在线)。计算语言学协会。
引用(非正式):
适用于IWSLT 2023的NVIDIA NeMo离线语音翻译系统(Hrinchuk等人,IWSLT 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.iwslt-1.42.pdf