@进展中{齐亚姆斯-塔尔-2023演讲,title=“基于基础模型和最佳传输的语音翻译:{UPC}at{IWSLT}23”,author=“齐亚姆斯、艾奥尼丝和I.G列戈、杰拉德和Fonollosa、Jose和R.Costa-juss,玛尔塔“,editor=“Salesky、Elizabeth和费德里科、马塞洛和Carpuat,海军陆战队”,booktitle=“第20届国际口语翻译大会论文集(IWSLT 2023)”,月=七月,年=“2023”,address=“加拿大多伦多(当面和在线)”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.iwslt-1.38”,doi=“10.18653/v1/2023.iwslt-1.38”,pages=“397--410”,abstract=“本文描述了UPC机器翻译小组提交给IWSLT 2023离线语音翻译任务的情况。我们的语音翻译系统使用语音(wav2vec 2.0)和文本(mBART50)的基础模型。我们将语音和文本编码器的暹罗语预训练步骤与CTC和Optimal Transport结合起来,以使语音表示适应文本模型的空间,从而最大限度地从MT进行转移学习。经过预训练后,我们在ST上通过交叉熵和知识提取对系统进行端到端微调。除了可用的ST语料库外,我们还使用SegAugment创建了合成数据,以更好地使我们的模型适应IWSLT测试集的自定义分段。我们最好的单一模型在MuST-C tst-COMMON上获得31.2 BLEU点,在IWLST.tst2020上获得29.8点,在新发布的IWSLT上获得33.4点。ACLdev2023.“,}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“tsiamas-etal-2023演讲”><标题信息><title>基于基础模型和最佳传输的语音翻译:IWSLT23的UPC</titleInfo><name type=“个人”>Ioannis齐亚姆斯<角色>作者</角色></name><name type=“个人”>杰拉德I.Gállego<角色>作者</角色></name><name type=“个人”>何塞Fonollosa公司<角色>作者</角色></name><name type=“个人”>玛尔塔R.Costa-jussá<角色>作者</角色></name><originInfo>发布日期:2023-07发布日期:</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第20届国际口语翻译大会(IWSLT 2023)会议记录</titleInfo><name type=“个人”>伊丽莎白Salesky公司<角色>编辑器</角色></name><name type=“个人”>马塞洛费德里科<角色>编辑器</角色></name><name type=“个人”><namePart type=“given”>海洋</namePart><namePart type=“family”>卡普瓦特</namePart><角色>编辑器</角色></name><originInfo>计算语言学协会<位置>加拿大多伦多(同人和在线)</place></originInfo>会议出版物</relatedItem>本文描述了UPC机器翻译小组提交给IWSLT 2023离线语音翻译任务的情况。我们的语音翻译系统使用语音(wav2vec 2.0)和文本(mBART50)的基础模型。我们将语音和文本编码器的暹罗语预训练步骤与CTC和Optimal Transport相结合,以使语音表示适应文本模型的空间,从而最大限度地从MT进行转移学习。经过预训练后,我们在ST上使用交叉熵和知识提取对系统进行端到端微调。除了可用的ST语料库外,我们还使用SegAugment创建了合成数据,以更好地使我们的模型适应IWSLT测试集的自定义分段。我们最好的单一模型在MuST-C tst-COMMON上获得31.2 BLEU点,在IWLST.tst2020上获得29.8点,在新发布的IWSLT上获得33.4点。ACLdev2023.</abstract>tsiamas-etal-2023演讲10.18653/v1/2023.iwslt-1.38<位置><网址>https://aclantology.org/2023.iwslt-1.38</url></位置><部分>2023-07年<扩展单元=“page”><开始>397</开始><end>410</end></范围></部分></mods></modsCollection>
%0会议记录%基于基础模型和最佳传输的T语言翻译:IWSLT23的UPC%Ioannis,齐亚姆斯%A I.Gállego,杰拉德%何塞·A Fonollosa%A R.Costa-jussá,玛尔塔%Y Salesky,伊丽莎白%Y Federico,马塞洛%Y Carpuat,海军%第20届国际口语翻译会议(IWSLT 2023)%D 2023年%7月8日%计算语言学协会%C加拿大多伦多(同人和在线)%F tsiamas-etal-2023演讲%本文描述了UPC机器翻译小组提交给IWSLT 2023离线语音翻译任务的情况。我们的语音翻译系统使用语音(wav2vec 2.0)和文本(mBART50)的基础模型。我们将语音和文本编码器的暹罗语预训练步骤与CTC和Optimal Transport结合起来,以使语音表示适应文本模型的空间,从而最大限度地从MT进行转移学习。经过预训练后,我们在ST上使用交叉熵和知识提取对系统进行端到端微调。除了可用的ST语料库外,我们还使用SegAugment创建了合成数据,以更好地使我们的模型适应IWSLT测试集的自定义分段。我们最好的单一模型在MuST-C tst-COMMON上获得31.2 BLEU点,在IWLST.tst2020上获得29.8点,在新发布的IWSLT上获得33.4点。ACLdev2023。%R10.18653/v1/2023.iwslt-1.38%U型https://aclantology.org/2023.iwslt-1.38%U型https://doi.org/10.18653/v1/2023.iwslt-1.38%电话397-410
降价(非正式)
[具有基础模型和最佳传输的语音翻译:IWSLT23的UPC](https://aclantology.org/2023.iwslt-1.38)(Tsiamas等人,IWSLT 2023)
国际计算语言学协会
- Ioannis Tsiamas、Gerard I.Gállego、Jose Fonollosa和Marta R.Costa-jussá。2023基于基础模型和最佳传输的语音翻译:IWSLT23的UPC.英寸第20届国际口语翻译大会(IWSLT 2023)会议记录,第397-410页,加拿大多伦多(同人和在线)。计算语言学协会。