@进行中{guo-etal-2022-hw,title=“{硬件}-{TSC}{'}s用于{IWSLT}2022评估的语音转换系统”,author=“郭嘉欣李、英禄和王明翰和乔、小松和王玉霞和尚、恒超和苏、张和Chen、Yimeng和张敏和陶世民Yang、Hao和秦,英“,editor=“Salesky、Elizabeth和费德里科、马塞洛和Costa-juss{\`a},玛尔塔“,booktitle=“第19届国际口语翻译大会(IWSLT 2022)会议记录”,月=5月,年=“2022”,address=“爱尔兰都柏林(常驻和在线)”,publisher=“计算语言学协会”,url=“https://aclantology.org/2022.iwslt-1.26",doi=“10.18653/v1/2022.iwslt-1.26”,pages=“293--297”,abstract=“本文介绍了IWSLT2022的HW-TSC{'}流水线和离线语音转换的结果。我们设计了一个由ASR模型、机器翻译模型和TTS模型组成的级联系统,用于将一种语言的语音转换为另一种语言(en-de)。对于ASR部分,我们发现通过集成多个异构ASR模型并对候选波束执行重新排序可以获得更好的性能。我们发现,将上下文软件重新存储策略和对域内数据集进行微调的MT模型相结合有助于提高性能。因为它可以缓解由于缺乏上下文而导致的笔录不一致的问题。最后,我们使用官方提供的VITS模型从翻译假设中复制音频文件。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“guo-etal-2022-hw”><标题信息>用于IWSLT 2022评估的HW-TSC语音转换系统</titleInfo><name type=“personal”>嘉兴郭<namePart type=“family”><角色>作者</角色></name><name type=“personal”>英陆<namePart type=“given”>李<namePart type=“family”><角色>作者</角色></name><name type=“personal”>明翰<namePart type=“given”>王<namePart type=“family”><角色>作者</角色></name><name type=“personal”>小松乔<namePart type=“family”><角色>作者</角色></name><name type=“personal”><namePart type=“given”>玉霞</namePart>王<namePart type=“family”><角色>作者</角色></name><name type=“personal”>恒超尚<角色>作者</角色></name><name type=“personal”>Chang(Chang)<namePart type=“family”>苏</namePart><角色>作者</角色></name><name type=“personal”><namePart type=“given”>沂蒙</namePart><namePart type=“family”>陈</namePart><角色>作者</角色></name><name type=“personal”>最小值<namePart type=“family”>张<角色>作者</角色></name><name type=“personal”>Shimin(西蒙)陶(Tao)<角色>作者</角色></name><name type=“personal”>郝(音译)杨<角色>作者</角色></name><name type=“personal”>应秦<角色>作者</角色></name><originInfo>2022-05发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息><title>第19届国际口语翻译大会论文集(IWSLT 2022)</title></titleInfo><name type=“personal”>伊丽莎白Salesky公司<角色>编辑器</角色></name><name type=“personal”>马塞洛费德里科<角色>编辑器</角色></name><name type=“personal”>玛尔塔<namePart type=“family”>Costa jussà</namePart>哥斯达黎加<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>爱尔兰都柏林(同人和在线)</place></originInfo>会议出版物</relatedItem>本文介绍了IWSLT 2022的HW-TSC离线语音转换流程和结果。我们设计了一个由ASR模型、机器翻译模型和TTS模型组成的级联系统,用于将一种语言的语音转换为另一种语言(en-de)。对于ASR部分,我们发现通过集成多个异构ASR模型并对候选波束进行重新排序可以获得更好的性能。我们发现,将上下文软件重新存储策略和对域内数据集进行微调的MT模型相结合有助于提高性能。因为它可以缓解由于缺乏上下文而导致的转录本不一致的问题。最后,我们使用官方提供的VITS模型从翻译假设中复制音频文件</摘要>guo-etal-2022-hw10.18653/v1/2022.iwslt-1.26<位置><网址>https://aclantology.org/2022.iwslt-1.26</url></位置><部分><日期>2022-05</日期><扩展单元=“page”><开始>293<end>297</范围></部分></mods></modsCollection>
%0会议记录%用于IWSLT 2022评估的HW-TSC语音转换系统%嘉兴阿果%阿丽、英禄%A Wang、Minghan%阿巧、小松%王玉霞%阿尚、恒超%阿苏,张%A Chen、Yimeng%阿章,敏%阿涛、石敏%阿阳,郝%阿琴,英%Y Salesky,伊丽莎白%Y Federico,马塞洛%Y Costa-jussá,玛尔塔%第19届国际口语翻译会议(IWSLT 2022)%D 2022年%5月8日%计算语言学协会%C都柏林,爱尔兰(现场和在线)%F guo-etal-2022-hw公司%X本文介绍了IWSLT 2022的HW-TSC离线语音转换的管道和结果。我们设计了一个由ASR模型、机器翻译模型和TTS模型组成的级联系统,用于将一种语言的语音转换为另一种语言(en-de)。对于ASR部分,我们发现通过集成多个异构ASR模型并对候选波束进行重新排序可以获得更好的性能。我们发现,将上下文软件重新存储策略和对域内数据集进行微调的MT模型相结合有助于提高性能。因为它可以缓解由于缺乏上下文而导致的笔录不一致的问题。最后,我们使用官方提供的VITS模型从翻译假设中复制音频文件。%R 10.18653/v1/2022.iwslt-1.26%U型https://aclantology.org/2022.iwslt-1.26%U型https://doi.org/10.18653/v1/2022.iwslt-1.26%电话293-297
降价(非正式)
【用于IWSLT 2022评估的HW-TSC语音转换系统】(https://aclantology.org/2022.iwslt-1.26)(Guo等人,IWSLT 2022)
国际计算语言学协会