低延迟同步语音翻译的端到端评估

克里斯蒂安·胡贝尔,杜安丁,卡洛斯·穆洛夫,Ngoc-Quan Pham公司,泰语Binh Nguyen,费比安·雷特科夫斯基,斯特凡·康斯坦丁,Enes Ugan公司,刘丹妮,李兆林,赛科内鲁,简·尼休斯,亚历山大·威贝尔


摘要
一些出版物和共享任务表明,低延迟语音翻译的挑战最近引起了研究界的极大兴趣。因此,有必要在现实场景中评估这些不同的方法。然而,目前只对系统的特定方面进行评估,通常无法比较不同的方法。在这项工作中,我们提出了第一个框架,用于在实际条件下执行和评估低延迟语音翻译的各个方面。评估以端到端的方式进行。这包括音频的分段以及不同组件的运行时间。其次,我们比较了使用该框架进行低延迟语音翻译的不同方法。我们评估了具有修改输出选项的模型以及具有固定输出的方法。此外,我们直接比较了最先进的级联系统和端到端系统。最后,该框架允许自动评估翻译质量和延迟,还提供了一个web界面,向用户显示低延迟模型输出。
选集ID:
2023.emnlp演示2
体积:
2023年自然语言处理实证方法会议记录:系统演示
月份:
十二月
年份:
2023
地址:
新加坡
编辑:
岩松峰,埃尔斯·利弗热
地点:
EMNLP公司
SIG公司:
发布者:
计算语言学协会
注:
页码:
12–20
语言:
网址:
https://aclantology.org/2023.emnlp-demo.2
内政部:
10.18653/v1/2023。emnlp演示2
比比键:
引用(ACL):
Christian Huber、Tu Anh Dinh、Carlos Mullov、Ngoc-Quan Pham、Thai Binh Nguyen、Fabian Retkowski、Stefan Constantin、Enes Ugan、Danni Liu、Zhaolin Li、Sai Koneru、Jan Niehues和Alexander Waibel。2023低延迟同步语音翻译的端到端评估.英寸2023年自然语言处理实证方法会议记录:系统演示,第12-20页,新加坡。计算语言学协会。
引用(非正式):
低延迟同步语音翻译的端到端评估(Huber等人,EMNLP 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.emnlp-demo.2.pdf
视频:
 https://aclantology.org/2023.emnlp-demo.2.mp4