这个硬件-TSC公司的语音转换系统IWSLT公司2022年评估

郭嘉欣李英禄王明翰小宋乔王玉霞商恒超张素(Chang Su)陈一萌张敏(音)石明涛郝阳应钦


摘要
本文介绍了用于IWSLT 2022的HW-TSC离线语音转换的管道和结果。我们设计了一个由ASR模型、机器翻译模型和TTS模型组成的级联系统,用于将一种语言的语音转换为另一种语言(en-de)。对于ASR部分,我们发现通过集成多个异构ASR模型并对候选波束进行重新排序可以获得更好的性能。我们发现,将上下文软件重新存储策略和对域内数据集进行微调的MT模型相结合有助于提高性能。因为它可以缓解由于缺乏上下文而导致的笔录不一致的问题。最后,我们使用官方提供的VITS模型从翻译假设中复制音频文件。
选集ID:
2022.iwslt-1.26年
体积:
第19届国际口语翻译会议记录(IWSLT 2022)
月份:
五月
年份:
2022
地址:
爱尔兰都柏林(现场和在线)
编辑:
伊丽莎白·塞尔斯基马塞洛·费德里科Marta Costa-jussá
地点:
IWSLT公司
SIG公司:
信号
出版商:
计算语言学协会
注:
页:
293–297
语言:
网址:
https://aclantology.org/2022.iwslt-1.26
内政部:
10.18653/v1/2022.iwslt-1.26
比比键:
引用(ACL):
郭嘉欣、李英璐、王明汉、乔晓松、王玉霞、尚恒超、苏畅、陈一萌、张敏、陶世民、杨浩和秦莹。2022用于IWSLT 2022评估的HW-TSC语音转换系统.英寸第19届国际口语翻译会议记录(IWSLT 2022),第293-297页,爱尔兰都柏林(同人和在线)。计算语言学协会。
引用(非正式):
用于IWSLT 2022评估的HW-TSC语音转换系统(Guo等人,IWSLT 2022)
复制引文:
PDF格式:
https://aclantology.org/2022.iwslt-1.26.pdf
数据
自由演讲