2R(右)的端到端语音翻译系统IWSLT公司2023离线共享任务

穆罕默德·胡扎法赫,凯·敏·谭,段日成


摘要
本文描述了I2R提交给IWSLT 2023离线语音翻译轨道的情况。我们专注于从英语音频到德语文本的端到端翻译方法,这是今年版的三个可用语言方向之一。I2R系统利用了预处理模型,这些模型已经暴露在我们的基本模型的大规模音频和文本数据中。我们引入了几个额外的预训练阶段,然后进行微调,以使系统适应下游语音翻译任务。该策略还辅以其他技术,如数据增强、领域标记、知识提取和模型集成等。我们在几个公开可用的测试集上评估系统,以进行比较。
选集ID:
2023.国际水资源管理体系-1.16
体积:
第20届国际口语翻译大会(IWSLT 2023)会议记录
月份:
七月
年份:
2023
地址:
加拿大多伦多(现场和在线)
编辑:
伊丽莎白·塞尔斯基,马塞洛·费德里科,海洋木瓜
地点:
IWSLT公司
SIG公司:
SIGSLT公司
出版商:
计算语言学协会
注:
页:
202–210
语言:
网址:
https://acl选集.org/2023.iwslt-1.16
内政部:
10.18653/v1/2023.iwslt-1.16
比比键:
引用(ACL):
穆罕默德·胡扎法赫(Muhammad Huzaifah)、凯敏·谭(Kye Min Tan)和段丽成(Richeng Duan)。2023I2R的IWSLT 2023离线共享任务端到端语音翻译系统.英寸第20届国际口语翻译大会(IWSLT 2023)会议记录,第202-210页,加拿大多伦多(个人和在线)。计算语言学协会。
引用(非正式):
I2R的IWSLT 2023离线共享任务端到端语音翻译系统(Huzaifah等人,IWSLT 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.iwslt-1.16.pdf