提交中国科学技术大学的系统IWSLT公司2023年-离线语音翻译轨道

周新源,崔建伟,中一冶,王一池,徐璐珍,Hanyi Zhang先生,张伟泰,戴丽蓉


摘要
本文描述了研究小组USTC-NELSLIP向2023年IWSLT离线语音翻译竞赛提交的材料,该竞赛涉及将英语口语翻译为汉语书面语。我们将级联模型和端到端模型用于此任务。为了提高级联模型的性能,我们引入了Whisper来减少中间源语言文本中的错误,从而显著提高了ASR识别性能。对于端到端模型,我们提出了堆叠声学和文本编码扩展(SATE-ex),该扩展将声学解码器的输出馈送到文本解码器以进行信息融合,并防止错误传播。此外,我们通过集成将SATE-ex模型与编码器-解码器模型相结合,提高了端到端系统的语音翻译性能。
选集ID:
2023.iwslt-1.15年
体积:
第20届国际口语翻译大会(IWSLT 2023)会议记录
月份:
七月
年份:
2023
地址:
加拿大多伦多(现场和在线)
编辑:
伊丽莎白·塞尔斯基,马塞洛·费德里科,海洋木瓜
地点:
IWSLT公司
SIG公司:
SIGSLT公司
出版商:
计算语言学协会
注:
页:
194–201
语言:
网址:
https://aclcollectory.org/2023.iwslt-1.15
内政部:
10.18653/v1/2023.iwslt-1.15
比比键:
引用(ACL):
周信源、崔建伟、叶忠义、王一慈、徐鲁珍、张汉毅、张伟泰和戴丽蓉。2023提交USTC的IWSLT 2023系统-离线语音翻译轨道.英寸第20届国际口语翻译大会(IWSLT 2023)会议记录,第194-201页,加拿大多伦多(个人和在线)。计算语言学协会。
引用(非正式):
提交USTC的IWSLT 2023系统-离线语音翻译轨道(Zhou等人,IWSLT 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.iwslt-1.15.pdf