超越句子级的端到端语音翻译:上下文帮助

张彪,伊万·蒂托夫,巴里·哈多,里科·森里奇


摘要
文档级上下文信息已显示出对基于文本的机器翻译的好处,但上下文是否以及如何帮助端到端(E2E)语音翻译(ST)仍有待研究。我们使用一个简单的基于级联的上下文软件ST模型,结合语音编码的自适应特征选择,通过大量实验来填补这一空白,以提高计算效率。我们研究了几种解码方法,并介绍了模型内集成解码,它使用相同的模型联合执行文档级和句子级翻译。我们在带有Transformer的MuST-C基准测试上的结果证明了上下文对E2E ST的有效性。与句子级ST相比,上下文软件ST获得了更好的翻译质量(+0.18-2.61 BLEU),改进了代词和同音词翻译,对(人工)音频分割错误表现出更好的鲁棒性,并减少延迟和闪烁,为同声翻译提供更高的质量。
选集ID:
2021.acl长2000
体积:
计算语言学协会第59届年会和第11届国际自然语言处理联合会议记录(第1卷:长篇论文)
月份:
八月
年份:
2021
地址:
在线的
编辑:
宗成庆,费霞,李文杰,罗伯托·纳维利
场馆:
国际计算语言学协会|国际JCNLP
SIG公司:
发布者:
计算语言学协会
注:
页:
2566–2578
语言:
网址:
https://aclantology.org/2021.acl-long.200
DOI(操作界面):
10.18653/v1/2021年10月16日至20日
比比键:
引用(ACL):
张彪(Biao Zhang)、伊万·蒂托夫(Ivan Titov)、巴里·哈多(Barry Haddow)和里科·森里奇(Rico Sennrich)。2021超越句子级的端到端语音翻译:上下文帮助.英寸计算语言学协会第59届年会和第11届国际自然语言处理联合会议记录(第1卷:长篇论文),第2566–2578页,在线。计算语言学协会。
引用(非正式):
超越句子级的端到端语音翻译:上下文帮助(Zhang等人,ACL-IJCNLP 2021)
复制引文:
PDF格式:
https://aclantology.org/2021.acl-long.200.pdf
视频:
 https://aclantology.org/2021.acl-long.200.mp4
代码
bzhangGo/zero
数据
MuST-C公司