SRI公司-B类的系统IWSLT公司2023年方言和低资源轨道:M(M)阿拉蒂人-H(H)印度语翻译

巴拉吉·拉达克里什南,索拉巴·阿格拉瓦尔,拉杰·普拉卡什·戈希尔,基兰·普拉文,Advait Vinay Dhopeshwarkar公司,阿布谢克·潘迪


摘要
本文描述了为IWSLT 2023评估活动方言和低资源项目:马拉地-印度语音翻译开发的语音翻译系统SRI-B。我们针对受限条件(系统仅在组织者提供的数据集上训练)和非受限条件(可以使用任何资源训练系统)提出了系统。对于这两种情况,我们构建了端到端的语音翻译网络,该网络由一个一致性编码器和一个变换器解码器组成。在这两种情况下,我们利用马拉地自动语音识别(ASR)数据对编码器进行预训练,然后根据语音翻译数据训练整个模型。我们的结果表明,使用ASR数据对编码器进行预训练是显著提高语音翻译性能的关键一步。我们还表明,在语音翻译任务中,一致性编码器本质上优于其对应的变压器编码器。我们的主要提交文件在约束条件下的BLEU%得分为31.2,在非约束条件下为32.4。我们在约束条件下固定了顶部位置,在无约束条件下固定了第二个位置。
选集ID:
2023.iwslt-1.43年
体积:
第20届国际口语翻译大会(IWSLT 2023)会议记录
月份:
七月
年份:
2023
地址:
加拿大多伦多(现场和在线)
编辑:
伊丽莎白·塞尔斯基,马塞洛·费德里科,海洋木瓜
地点:
IWSLT公司
SIG公司:
SIGSLT公司
出版商:
计算语言学协会
注:
页:
449–454
语言:
网址:
https://aclantology.org/2023.iwslt-1.43
内政部:
10.18653/v1/2023.iwslt-1.43
比比键:
引用(ACL):
巴拉吉·拉德哈克里什南、索拉巴·阿格拉瓦尔、拉杰·普拉卡什·戈希尔、基兰·普拉文、阿德瓦伊特·维奈·多普什瓦尔卡和阿比舍克·潘迪。2023SRI-B的IWSLT 2023方言和低资源轨道系统:马拉地语-印度语语音翻译.英寸第20届国际口语翻译大会(IWSLT 2023)会议记录,第449-454页,加拿大多伦多(同人和在线)。计算语言学协会。
引用(非正式):
SRI-B的IWSLT 2023方言和低资源轨道系统:马拉地语-印度语语音翻译(Radhakrishnan等人,IWSLT 2023)
复制引文:
PDF格式:
https://aclantology.org/2023.iwslt-1.43.pdf