E类丁堡的端到端多语言语音翻译系统IWSLT公司2021

张彪,里科·森里奇


摘要
本文描述了爱丁堡提交给IWSLT2021多语种语音翻译(ST)任务的材料。我们的目标是通过鼓励转移学习和使用高级神经组件进行更大容量建模的方法,在受限环境下(不使用任何额外的训练数据)改进多语言翻译和零快照性能。我们构建了基于Transformer的端到端多语言ST模型,集成了自适应语音特征选择、特定语言建模、多任务学习、深度和大型Transformer、稀疏线性注意和均方根层归一化等技术。我们使用机器翻译模型对ST进行数据增强,将零快照问题转化为零源问题。实验结果表明,这些方法取得了实质性的改进,平均BLEU超过官方基准>15,平均BLUE超过我们的级联系统>2。我们的最终提交获得了竞争性表现(亚军)。
选集ID:
2021.iwslt-1.19年
体积:
第十八届国际口语翻译大会(IWSLT 2021)会议记录
月份:
八月
年份:
2021
地址:
泰国曼谷(在线)
编辑:
马塞洛·费德里科,亚历克斯·魏贝尔,Marta R.Costa-jussá,简·尼休斯,塞巴斯蒂安·斯塔克,伊丽莎白·塞尔斯基
地点:
IWSLT公司
SIG公司:
SIGSLT公司
发布者:
计算语言学协会
注:
页:
160–168
语言:
网址:
https://aclantology.org/2021.iwslt-1.19
DOI(操作界面):
10.18653/v1/2021.iwslt-1.19
比比键:
引用(ACL):
张彪和里科·森里奇。2021爱丁堡IWSLT 2021的端到端多语言语音翻译系统.英寸第十八届国际口语翻译大会(IWSLT 2021)会议记录,第160–168页,泰国曼谷(在线)。计算语言学协会。
引用(非正式):
爱丁堡IWSLT 2021的端到端多语言语音翻译系统(Zhang&Sennrich,IWSLT 2021)
复制引文:
PDF格式:
https://aclantology.org/2021.iwslt-1.19.pdf