JHU公司 IWSLT公司2023方言语音翻译系统描述

阿米尔·侯赛因,萧慈涵,尼哈·维尔玛,托马斯·特波特,马修·维斯纳,桑吉夫·库丹普尔


摘要
本文介绍了JHU向IWSLT 2023提交的突尼斯阿拉伯语到英语语音翻译的方言和低资源轨道。突尼斯方言缺乏正式的正字法和丰富的训练数据,这使得开发有效的语音翻译(ST)系统具有挑战性。为了应对这些挑战,我们探索了在端到端(E2E)和级联语音翻译(ST)系统中集成大型预训练机器翻译(MT)模型,如mBART和NLLB-200。我们还通过在电话数据上使用伪标签数据增强和信道匹配来提高自动语音识别(ASR)的性能。最后,我们将E2E和级联ST系统与最小贝叶斯风险解码相结合。我们的组合系统在test2和test3上分别获得21.6和19.1的BLEU分数。
选集ID:
2023.iwslt-1.26年
体积:
第20届国际口语翻译大会(IWSLT 2023)会议记录
月份:
七月
年份:
2023
地址:
加拿大多伦多(现场和在线)
编辑:
伊丽莎白·塞尔斯基,马塞洛·费德里科,海洋木瓜
地点:
IWSLT公司
SIG公司:
SIGSLT公司
出版商:
计算语言学协会
注:
页:
283–290
语言:
网址:
https://aclantology.org/2023.iwslt-1.26
内政部:
10.18653/v1/2023.iwslt-1.26
比比键:
引用(ACL):
阿米尔·侯赛因(Amir Hussein)、西汉·肖(Cihan Xiao)、内哈·维尔玛(Neha Verma)、托马斯·特波德(Thomas Thebaud)、马修·维斯纳(Matthew Wiesner)和桑吉夫·库丹布尔。2023JHU IWSLT 2023方言语音翻译系统描述.英寸第20届国际口语翻译大会(IWSLT 2023)会议记录,第283-290页,加拿大多伦多(个人和在线)。计算语言学协会。
引用(非正式):
JHU IWSLT 2023方言语音翻译系统描述(侯赛因等人,IWSLT 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.iwslt-1.26.pdf