@正在进行{kesiraju-etal-2023系统,title=“{IWSLT}2023{M}arathi-{H}indi低资源语音翻译任务的{BUT}系统”,author=“Kesiraju、Santosh和贝尼、卡雷尔和蒂霍诺夫、马克西姆和{\v{C}}ernock{\'y},Jan“,editor=“Salesky、Elizabeth和费德里科、马塞洛和Carpuat,Marine“,booktitle=“第20届国际口语翻译会议(IWSLT 2023)论文集”,月=七月,年=“2023”,address=“加拿大多伦多(当面和在线)”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.iwslt-1.19”,doi=“10.18653/v1/2023.iwslt-1.19”,页码=“227--234”,抽象=“本文描述了为马拉地语到印地语低资源语音翻译任务提交的系统。我们的主要提交基于端到端直接语音翻译系统,而对比系统是级联系统。这两个系统的主干是一个印地语-马拉地文双语ASR系统,该系统经过2790小时的不完全翻译训练录音讲话。端到端语音翻译系统直接从ASR初始化,然后进行微调以进行直接语音翻译,并附带翻译的CTC损失。级联系统的机器翻译模型由跨语言语言模型初始化,然后使用1.6M个平行句子对其进行微调。我们所有的系统都是在公共数据集上从头开始培训的。最后,我们使用一个语言模型来重新定义n个最佳假设。我们的第一次提交达到30.5和39.6 BLEU,而对比系统在官方开发和测试集上分别获得21.7和28.6 BLEU。本文还对所进行的几个实验进行了分析,并概述了在低资源场景中改进语音翻译的策略。",}
<?xml版本=“1.0”编码=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“kesiraju-etal-2023系统”><标题信息>IWSLT 2023 Marathi-印地语低资源语音翻译任务的BUT系统</titleInfo><name type=“personal”>桑托什凯西拉朱<角色><roleTerm authority=“marcorrator”type=“text”>作者</roleTerm></角色></name><name type=“personal”>卡雷尔贝内什<角色><roleTerm authority=“marcorrator”type=“text”>作者</roleTerm></角色></name><name type=“personal”>马克西姆蒂霍诺夫<角色><roleTerm authority=“marcorrator”type=“text”>作者</roleTerm></角色></name><name type=“personal”>一月乔尔诺克<角色><roleTerm authority=“marcorrator”type=“text”>作者</roleTerm></角色></name><originInfo><日期发布>2023-07</日期发布></originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第20届国际口语翻译大会(IWSLT 2023)会议记录</titleInfo><name type=“personal”><namePart type=“given”>伊丽莎白</namePart>Salesky公司<角色><roleTerm authority=“marcorrator”type=“text”>编辑器</roleTerm></角色></name><name type=“personal”>马塞洛费德里科<角色><roleTerm authority=“marcorrator”type=“text”>编辑器</roleTerm></角色></name><name type=“personal”><namePart type=“given”>海洋</namePart>卡普阿特<角色><roleTerm authority=“marcorrator”type=“text”>编辑器</roleTerm></角色></name><originInfo>计算语言学协会<位置>加拿大多伦多(同人和在线)</place></originInfo>会议出版物</relatedItem>本文描述了为马拉地语到印地语低资源语音翻译任务提交的系统。我们的主要提交基于端到端直接语音翻译系统,而对比系统是级联系统。这两个系统的主干都是一个Hindi-Marathi双语ASR系统,该系统接受了2790小时的不完全转录语音训练。端到端语音翻译系统直接从ASR初始化,然后进行微调以进行直接语音翻译,并附带翻译的CTC损失。级联系统的机器翻译模型由跨语言语言模型初始化,然后使用1.6M个平行句子对其进行微调。我们所有的系统都是在公共数据集上从头开始培训的。最后,我们使用一个语言模型来重新定义n个最佳假设。我们的第一次提交达到30.5和39.6 BLEU,而对比系统在官方开发和测试集上分别获得21.7和28.6 BLEU。本文还对所进行的几个实验进行了分析,并概述了在低资源场景中改进语音翻译的策略</摘要>kesiraju-etal-2023系统10.18653/v1/2023.iwslt-1.19<位置><网址>https://aclantology.org/2023.iwslt-1.19</url></位置><部分>2023-07年<扩展单元=“page”><开始>227</开始><end>234</范围></部分></模块></modsCollection>
%0会议记录%IWSLT 2023马拉地语-印地语低资源语音翻译任务的T BUT系统%A Kesiraju,桑托什%卡雷尔·贝内什%马克西姆·A Tikhonov%阿切尔诺克,简%Y Salesky,伊丽莎白%Y Federico,马塞洛%Y Carpuat,海军%第20届国际口语翻译会议(IWSLT 2023)%D 2023年%7月8日%计算语言学协会%C加拿大多伦多(同人和在线)%F kesiraju-etal-2023系统%本文介绍了为马拉地语到印地语低资源语音翻译任务提交的系统。我们的主要提交基于端到端直接语音翻译系统,而对比系统是级联系统。这两个系统的主干是一个印地语-马拉地语双语ASR系统,该系统训练了2790小时的不完美转录语音。端到端语音翻译系统直接从ASR初始化,然后进行微调以进行直接语音翻译,并附带翻译的CTC损失。级联系统的机器翻译模型是从跨语言语言模型初始化的,然后使用1.6M个平行句子对其进行微调。我们所有的系统都是在公共数据集上从头开始培训的。最后,我们使用一个语言模型来重新定义n个最佳假设。我们的第一次提交达到30.5和39.6 BLEU,而对比系统在官方开发和测试集上分别获得21.7和28.6 BLEU。本文还对所进行的几个实验进行了分析,并概述了在低资源场景中改进语音翻译的策略。%R10.18653/v1/2023.iwslt-1.19%U型https://aclantology.org/2023.iwslt-1.19%U型https://doi.org/10.18653/v1/2023.iwslt-1.19%电话227-234
降价(非正式)
[IWSLT 2023马拉地语-印地语低资源语音翻译任务的BUT系统](https://aclantology.org/2023.iwslt-1.19)(Kesiraju等人,IWSLT 2023)
国际计算语言学协会