@进行中{侯赛因-埃塔尔-2023-jhu,title=“{JHU}{IWSLT}2023方言语音翻译系统描述”,author=“侯赛因、阿米尔和肖、慈涵和Verma、Neha和Thebaud、Thomas和维斯纳、马修和昆丹普尔,桑吉夫“,editor=“Salesky、Elizabeth和费德里科、马塞洛和Carpuat,海军陆战队”,booktitle=“第20届国际口语翻译大会论文集(IWSLT 2023)”,月=七月,年=“2023”,address=“加拿大多伦多(当面和在线)”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.iwslt-1.26”,doi=“10.18653/v1/2023.iwslt-1.26”,pages=“283--290”,abstract=“本文介绍了JHU向IWSLT 2023提交的突尼斯阿拉伯语到英语语音翻译的方言和低资源轨迹。突尼斯方言缺乏正式的正字法和丰富的训练数据,这使得开发有效的语音翻译(ST)具有挑战性系统。为了应对这些挑战,我们探索了在端到端(E2E)和级联语音翻译(ST)系统中集成大型预训练机器翻译(MT)模型,如mBART和NLLB-200。我们还通过在电话数据上使用伪标签数据增强和信道匹配来提高自动语音识别(ASR)的性能。最后,我们将我们的E2E和级联ST系统与最小贝叶斯风险解码相结合。我们的组合系统在test2和test3上分别获得21.6和19.1的BLEU分数。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“hussein-etal-2023-jhu”><标题信息>JHU IWSLT 2023方言语音翻译系统描述</titleInfo><name type=“个人”>Amir(阿米尔)侯赛因<角色>作者</角色></name><name type=“个人”>慈汉肖(Xiao)<角色>作者</角色></name><name type=“个人”>Neha(奈哈)维尔玛<角色>作者</角色></name><name type=“个人”>托马斯Thebaud<角色>作者</角色></name><name type=“个人”>马修Wiesner(维斯纳)<角色>作者</角色></name><name type=“个人”>桑吉夫昆丹普尔<角色>作者</角色></name><originInfo>发布日期:2023-07发布日期:</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第20届国际口语翻译大会(IWSLT 2023)会议记录</titleInfo><name type=“个人”>伊丽莎白Salesky公司<角色>编辑器</角色></name><name type=“个人”>马塞洛费德里科<角色>编辑器</角色></name><name type=“个人”><namePart type=“given”>海洋</namePart><namePart type=“family”>卡普瓦特</namePart><角色>编辑器</角色></name><originInfo>计算语言学协会<位置>加拿大多伦多(同人和在线)</place></originInfo>会议出版物</relatedItem>本文介绍了JHU向IWSLT 2023提交的突尼斯阿拉伯语到英语语音翻译的方言和低资源轨道。突尼斯方言缺乏正式的正字法和丰富的训练数据,这使得开发有效的语音翻译(ST)系统具有挑战性。为了应对这些挑战,我们探索了在端到端(E2E)和级联语音翻译(ST)系统中集成大型预训练机器翻译(MT)模型,如mBART和NLLB-200。我们还通过在电话数据上使用伪标签数据增强和信道匹配来提高自动语音识别(ASR)的性能。最后,我们将E2E和级联ST系统与最小贝叶斯风险解码相结合。我们的组合系统在test2和test3上分别获得21.6和19.1的BLEU分数</摘要><identifier type=“citekey”>侯赛因·塔尔-2023-jhu</identifier>10.18653/v1/2023.iwslt-1.26<位置><网址>https://aclantology.org/2023.iwslt-1.26</url></位置><部分>2023-07年<扩展单元=“page”><start>283</start><end>290</范围></部分></mods></modsCollection>
%0会议记录%T JHU IWSLT 2023方言语音翻译系统描述%阿米尔·侯赛因%阿肖,慈汉%阿维玛,尼哈%A Thebaud,托马斯%A Wiesner,马修%A Khudanpur,桑吉夫%Y Salesky,伊丽莎白%Y Federico,马塞洛%Y Carpuat,海军%第20届国际口语翻译会议(IWSLT 2023)%D 2023年%7月8日%计算语言学协会%C加拿大多伦多(同人和在线)%F hussein-etal-2023-jhu公司%X本文介绍了JHU向IWSLT 2023提交的突尼斯阿拉伯语到英语语音翻译的方言和低资源轨道。突尼斯方言缺乏正式的正字法和丰富的训练数据,这使得开发有效的语音翻译(ST)系统具有挑战性。为了应对这些挑战,我们探索了在端到端(E2E)和级联语音翻译(ST)系统中集成大型预训练机器翻译(MT)模型,如mBART和NLLB-200。我们还通过对电话数据使用伪标记数据增强和信道匹配来提高自动语音识别(ASR)的性能。最后,我们将E2E和级联ST系统与最小贝叶斯风险解码相结合。我们的组合系统在test2和test3上分别获得21.6和19.1的BLEU分数。%R10.18653/v1/2023.iwslt-1.26%U型https://aclantology.org/2023.iwslt-1.26%U型https://doi.org/10.18653/v1/2023.iwslt-1.26%电话283-290
降价(非正式)
[JHU IWSLT 2023方言语音翻译系统描述](https://aclantology.org/2023.iwslt-1.26)(侯赛因等人,IWSLT 2023)
国际计算语言学协会
- 阿米尔·侯赛因(Amir Hussein)、西汉·肖(Cihan Xiao)、内哈·维尔玛(Neha Verma)、托马斯·特波德(Thomas Thebaud)、马修·维斯纳(Matthew Wiesner)和桑吉夫·库丹布尔。2023JHU IWSLT 2023方言语音翻译系统描述.英寸第20届国际口语翻译大会(IWSLT 2023)会议记录,第283-290页,加拿大多伦多(个人和在线)。计算语言学协会。