@进行中{radhakrishnan-etal-2023-sri,title=“{SRI}-{B}{'}s系统用于{IWSLT}2023方言和低资源音轨:{M}arathi-{H}indi Speech Translation”,author=“Radhakrishnan、Balaji和阿格拉瓦尔、索拉巴和Prakash Gohil、Raj和Praveen、Kiran和Vinay Dhopeshwarkar、Advait和潘迪,阿披实“,editor=“Salesky、Elizabeth和费德里科、马塞洛和Carpuat,海军陆战队”,booktitle=“第20届国际口语翻译大会论文集(IWSLT 2023)”,月=七月,年=“2023”,address=“加拿大多伦多(当面和在线)”,publisher=“计算语言学协会”,url=“https://aclcollectory.org/2023.iwslt-1.43”,doi=“10.18653/v1/2023.iwslt-1.43”,pages=“449--454”,abstract=“本文描述了为IWSLT 2023年评估活动方言和低资源轨道:马拉地-印度语语音翻译开发的语音翻译系统SRI-B。我们提出了两种受限的系统(系统仅根据组织者提供的数据集进行训练)以及无约束条件(系统可以使用任何资源进行训练)。对于这两种情况,我们构建了端到端的语音翻译网络,该网络由一个一致性编码器和一个变换器解码器组成。在这两种情况下,我们利用马拉地自动语音识别(ASR)数据对编码器进行预训练,然后根据语音翻译数据训练整个模型。我们的结果表明,使用ASR数据对编码器进行预训练是显著提高语音翻译性能的关键步骤。我们还表明,在语音翻译任务中,一致性编码器本质上优于其对应的变压器编码器。我们的主要提交文件在约束条件下的BLEU{\%}得分为31.2,在非约束条件下为32.4。我们在约束条件下确保了顶部位置,在非约束条件下保证了第二个位置。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“radhakrishnan-etal-2023-sri”><标题信息>SRI-B的IWSLT 2023方言和低资源轨道系统:马拉地语-印度语语音翻译</titleInfo><name type=“个人”><namePart type=“given”>Balaji</namePart>巴拉吉</namePart拉达克里什南<角色>作者</角色></name><name type=“个人”>沙特<namePart type=“family”>阿格拉瓦尔</namePart><角色>作者</角色></name><name type=“个人”>拉吉普拉卡什·戈希尔<角色>作者</角色></name><name type=“个人”>基兰普拉芬<角色>作者</角色></name><name type=“个人”>高级Vinay Dhopeshwarkar<角色>作者</角色></name><name type=“个人”>阿比舍克潘迪<角色>作者</角色></name><originInfo>发布日期:2023-07发布日期:</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第20届国际口语翻译大会(IWSLT 2023)会议记录</titleInfo><name type=“个人”>伊丽莎白Salesky公司<角色>编辑器</角色></name><name type=“个人”>马塞洛费德里科<角色>编辑器</角色></name><name type=“个人”><namePart type=“given”>海洋</namePart><namePart type=“family”>卡普瓦特</namePart><角色>编辑器</角色></name><originInfo>计算语言学协会<位置>加拿大多伦多(同人和在线)</place></originInfo>会议出版物</relatedItem>本文描述了为IWSLT 2023评估活动方言和低资源项目:马拉地-印度语语音翻译开发的语音翻译系统SRI-B。我们针对受限条件(系统仅在组织者提供的数据集上训练)和非受限条件(可以使用任何资源训练系统)提出了系统。对于这两种情况,我们构建了端到端的语音翻译网络,该网络由一个一致性编码器和一个变换器解码器组成。在这两种情况下,我们利用马拉地自动语音识别(ASR)数据对编码器进行预训练,然后根据语音翻译数据训练整个模型。我们的结果表明,使用ASR数据对编码器进行预训练是显著提高语音翻译性能的关键步骤。我们还表明,在语音翻译任务中,一致性编码器本质上优于其对应的变压器编码器。我们的主要提交文件在约束条件下的BLEU%得分为31.2,在非约束条件下为32.4。我们在约束条件下确保了顶部位置,在非约束条件下保证了第二个位置</摘要><identifier type=“citekey”>radhakrishnan-etal-2023-sri10.18653/v1/2023.iwslt-1.43<位置><网址>https://aclantology.org/2023.iwslt-1.43</url></位置><部分>2023-07年<扩展单元=“page”><开始>449<end>454</范围></部分></mods></modsCollection>
%0会议记录%T SRI-B的IWSLT 2023拨号和低资源轨道系统:马拉地-印地语语音翻译%A Radhakrishnan,巴拉吉%阿格拉瓦尔,索拉巴%拉吉·A Prakash Gohil%基兰·A·普拉文%A Vinay Dhopeshwarkar,Advait公司%阿披实·A Pandey%Y Salesky,伊丽莎白%Y Federico,马塞洛%Y Carpuat,海军%第20届国际口语翻译会议(IWSLT 2023)%D 2023年%7月8日%计算语言学协会%C加拿大多伦多(同人和在线)%F radhakrishnan-etal-2023-sri公司%本文描述了为IWSLT 2023评估活动方言和低资源项目:马拉地-印度语语音翻译开发的语音翻译系统SRI-B。我们针对受限条件(系统仅在组织者提供的数据集上训练)和非受限条件(可以使用任何资源训练系统)提出了系统。对于这两种情况,我们构建了端到端的语音翻译网络,该网络由一个一致性编码器和一个变换器解码器组成。在这两种情况下,我们利用马拉地自动语音识别(ASR)数据对编码器进行预训练,然后根据语音翻译数据训练整个模型。我们的结果表明,使用ASR数据对编码器进行预训练是显著提高语音翻译性能的关键步骤。我们还表明,在语音翻译任务中,构象编码器本质上优于转换器编码器。我们的主要提交文件在约束条件下的BLEU%得分为31.2,在非约束条件下为32.4。我们在约束条件下确保了顶部位置,在非约束条件下保证了第二个位置。%R 10.18653/v1/2023.iwslt-1.43%U型https://aclantology.org/2023.iwslt-1.43%U型https://doi.org/10.18653/v1/2023.iwslt-1.43%电话449-454
降价(非正式)
[SRI-B的IWSLT 2023方言和低资源轨道系统:马拉地语-印度语语音翻译](https://aclantology.org/2023.iwslt-1.43)(Radhakrishnan等人,IWSLT 2023)
国际计算语言学协会