Submission of USTC’s System for the IWSLT 2023 - Offline Speech Translation Track

Xinyuan Zhou; Jianwei Cui; Zhongyi Ye; Yichi Wang; Luzhen Xu; Hanyi Zhang; Weitai Zhang; Lirong Dai

doi:10.18653/v1/2023.iwslt-1.15

提交中国科学技术大学的系统IWSLT公司2023年-离线语音翻译轨道

周新源,崔建伟,中一冶,王一池,徐璐珍,Hanyi Zhang先生,张伟泰,戴丽蓉

摘要

本文描述了研究小组USTC-NELSLIP向2023年IWSLT离线语音翻译竞赛提交的材料，该竞赛涉及将英语口语翻译为汉语书面语。我们将级联模型和端到端模型用于此任务。为了提高级联模型的性能，我们引入了Whisper来减少中间源语言文本中的错误，从而显著提高了ASR识别性能。对于端到端模型，我们提出了堆叠声学和文本编码扩展（SATE-ex），该扩展将声学解码器的输出馈送到文本解码器以进行信息融合，并防止错误传播。此外，我们通过集成将SATE-ex模型与编码器-解码器模型相结合，提高了端到端系统的语音翻译性能。

选集ID：: 2023.iwslt-1.15年
体积：: 第20届国际口语翻译大会（IWSLT 2023）会议记录
月份：: 七月
年份：: 2023
地址：: 加拿大多伦多（现场和在线）
编辑：: 伊丽莎白·塞尔斯基,马塞洛·费德里科,海洋木瓜
地点：: IWSLT公司
SIG公司：: SIGSLT公司
出版商：: 计算语言学协会
注：
页：: 194–201
语言：
网址：: https://aclcollectory.org/2023.iwslt-1.15
内政部：: 10.18653/v1/2023.iwslt-1.15
比比键：
引用（ACL）：: 周信源、崔建伟、叶忠义、王一慈、徐鲁珍、张汉毅、张伟泰和戴丽蓉。2023提交USTC的IWSLT 2023系统-离线语音翻译轨道.英寸第20届国际口语翻译大会（IWSLT 2023）会议记录，第194-201页，加拿大多伦多（个人和在线）。计算语言学协会。
引用（非正式）：: 提交USTC的IWSLT 2023系统-离线语音翻译轨道（Zhou等人，IWSLT 2023）
复制引文：
PDF格式：: https://aclantology.org/2023.iwslt-1.15.pdf

PDF格式引用搜索