The HW-TSC’s Speech to Speech Translation System for IWSLT 2022 Evaluation

Jiaxin Guo; Yinglu Li; Minghan Wang; Xiaosong Qiao; Yuxia Wang; Hengchao Shang; Chang Su; Yimeng Chen; Min Zhang; Shimin Tao; Hao Yang; Ying Qin

doi:10.18653/v1/2022.iwslt-1.26

这个硬件-TSC公司的语音转换系统IWSLT公司2022年评估

郭嘉欣，李英禄，王明翰，小宋乔，王玉霞，商恒超，张素（Chang Su），陈一萌，张敏（音），石明涛，郝阳，应钦

摘要

本文介绍了用于IWSLT 2022的HW-TSC离线语音转换的管道和结果。我们设计了一个由ASR模型、机器翻译模型和TTS模型组成的级联系统，用于将一种语言的语音转换为另一种语言（en-de）。对于ASR部分，我们发现通过集成多个异构ASR模型并对候选波束进行重新排序可以获得更好的性能。我们发现，将上下文软件重新存储策略和对域内数据集进行微调的MT模型相结合有助于提高性能。因为它可以缓解由于缺乏上下文而导致的笔录不一致的问题。最后，我们使用官方提供的VITS模型从翻译假设中复制音频文件。

选集ID：: 2022.iwslt-1.26年
体积：: 第19届国际口语翻译会议记录（IWSLT 2022）
月份：: 五月
年份：: 2022
地址：: 爱尔兰都柏林（现场和在线）
编辑：: 伊丽莎白·塞尔斯基，马塞洛·费德里科，Marta Costa-jussá
地点：: IWSLT公司
SIG公司：: 信号
出版商：: 计算语言学协会
注：
页：: 293–297
语言：
网址：: https://aclantology.org/2022.iwslt-1.26
内政部：: 10.18653/v1/2022.iwslt-1.26
比比键：
引用（ACL）：: 郭嘉欣、李英璐、王明汉、乔晓松、王玉霞、尚恒超、苏畅、陈一萌、张敏、陶世民、杨浩和秦莹。2022用于IWSLT 2022评估的HW-TSC语音转换系统.英寸第19届国际口语翻译会议记录（IWSLT 2022），第293-297页，爱尔兰都柏林（同人和在线）。计算语言学协会。
引用（非正式）：: 用于IWSLT 2022评估的HW-TSC语音转换系统（Guo等人，IWSLT 2022）
复制引文：
PDF格式：: https://aclantology.org/2022.iwslt-1.26.pdf
数据: 自由演讲

PDF格式引用搜索