NAIST Simultaneous Speech-to-speech Translation System for IWSLT 2023

Ryo Fukuda; Yuta Nishikawa; Yasumasa Kano; Yuka Ko; Tomoya Yanagita; Kosuke Doi; Mana Makinae; Sakriani Sakti; Katsuhito Sudoh; Satoshi Nakamura

doi:10.18653/v1/2023.iwslt-1.31

NAIST公司用于IWSLT公司2023

福田良,西川育塔,雅苏马萨·卡诺,尤卡·科,柳田富也,Kosuke Doi公司,马纳马基纳,Sakriani Sakti公司,胜下洙（Katsuhito Sudoh）,中村佐治

摘要

本文描述了NAIST提交给IWSLT 2023同步语音翻译任务的情况：英语到德语、日语、汉语演讲到文本翻译和英语到日语演讲到语音翻译。我们的语音到文本系统使用基于大规模预训练语音和文本模型的端到端多语言语音翻译模型。我们将Inter连接添加到模型中，以合并来自预训练语音模型的中间层的输出，并使用双语前缀对齐来增加前缀到前缀的文本数据，以增强离线语音翻译模型的同时性。我们的语音转换系统采用了一个增量文本语音模块，该模块由日语发音估计模型、声学模型和神经声码器组成。

选集ID：: 2023.iwslt-1.31年
体积：: 第20届国际口语翻译大会（IWSLT 2023）会议记录
月份：: 七月
年份：: 2023
地址：: 加拿大多伦多（现场和在线）
编辑：: 伊丽莎白·塞尔斯基,马塞洛·费德里科,海洋木瓜
地点：: IWSLT公司
SIG公司：: SIGSLT公司
出版商：: 计算语言学协会
注：
页：: 330–340
语言：
网址：: https://aclantology.org/2023.iwslt-1.31
内政部：: 10.18653/v1/2023.iwslt-1.31
比比键：
引用（ACL）：: 福田良彦、西川由塔、卡诺靖久、高裕嘉、柳田富也、小久弥、马纳牧野、坂崎、铃木和中村佐治。2023用于IWSLT 2023的NAIST语音对语音同步翻译系统.英寸第20届国际口语翻译大会（IWSLT 2023）会议记录，第330–340页，加拿大多伦多（个人和在线）。计算语言学协会。
引用（非正式）：: 用于IWSLT 2023的NAIST同步语音转换系统（福田等人，IWSLT 2023）
复制引文：
PDF格式：: https://aclantology.org/2023.iwslt-1.31.pdf

PDF格式引用搜索