@正在进行中{福田电气-2023-naist,title=“{NAIST}2023年{IWSLT}同步语音转换系统”,author=“福田、Ryo和西川、尤塔和卡诺、Yasumasa和Ko、Yuka和柳城、富古屋和Doi、Kosuke和Makinae、Mana和Sakti、Sakriani和Sudoh、Katsuhito和中村佐治“,editor=“Salesky、Elizabeth和费德里科、马塞洛和Carpuat,海军陆战队”,booktitle=“第20届国际口语翻译大会论文集(IWSLT 2023)”,月=七月,年=“2023”,address=“加拿大多伦多(当面和在线)”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.iwslt-1.31”,doi=“10.18653/v1/2023.iwslt-1.31”,pages=“330--340”,abstract=“本文描述了NAIST{'}提交给IWSLT 2023同步语音翻译任务:英语到德语、日语、汉语的演讲到文本翻译和英语到日语的演讲到演讲翻译。我们的语音到文本系统使用基于大规模预训练语音和文本模型的端到端多语言语音翻译模型。我们在模型中添加了互连,以合并预训练语音模型中间层的输出,并使用双语前缀对齐来增加前缀到前缀的文本数据,以增强离线语音翻译模型的同时性。我们的语音转换系统采用了一个增量文本语音模块,该模块由日语发音估计模型、声学模型和神经声码器组成。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“fukuda-etal-2023-naist”><标题信息>用于IWSLT 2023的NAIST同步语音转换系统</titleInfo><name type=“个人”><namePart type=“given”>Ryo</namePart><namePart type=“family”>福田</namePart><角色>作者</角色></name><name type=“个人”>尤塔西川<namePart type=“family”><角色>作者</角色></name><name type=“个人”><namePart type=“given”>Yasumasa卡诺<角色>作者</角色></name><name type=“个人”>尤卡Ko公司<角色>作者</角色></name><name type=“个人”><namePart type=“given”>Tomoya</namePart><namePart type=“family”>柳田</namePart><角色>作者</角色></name><name type=“个人”>KosukeDoi(Doi)<角色>作者</角色></name><name type=“个人”>魔法牧区<角色>作者</角色></name><name type=“个人”>萨基里亚尼语萨克蒂<角色>作者</角色></name><name type=“个人”>胜本<namePart type=“given”><namePart type=“family”>数独</namePart><角色>作者</角色></name><name type=“个人”>佐藤<namePart type=“given”><namePart type=“family”>Nakamura</namePart><角色>作者</角色></name><originInfo>发布日期:2023-07发布日期:</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>第20届国际口语翻译大会(IWSLT 2023)会议记录</titleInfo><name type=“个人”>伊丽莎白Salesky公司<角色>编辑器</角色></name><name type=“个人”>马塞洛费德里科<角色>编辑器</角色></name><name type=“个人”><namePart type=“given”>海洋</namePart><namePart type=“family”>卡普瓦特</namePart><角色>编辑器</角色></name><originInfo>计算语言学协会<位置>加拿大多伦多(同人和在线)</place></originInfo>会议出版物</relatedItem><摘要>本文描述了NAIST提交给IWSLT 2023同步语音翻译任务的情况:英语到德语、日语、汉语的演讲到文本翻译和英语到日语的演讲到演讲翻译。我们的语音到文本系统使用基于大规模预训练语音和文本模型的端到端多语言语音翻译模型。我们在模型中添加了互连,以合并预训练语音模型中间层的输出,并使用双语前缀对齐来增加前缀到前缀的文本数据,以增强离线语音翻译模型的同时性。我们的语音转换系统采用了一个增量文本语音模块,该模块由日语发音估计模型、声学模型和神经声码器组成</摘要>福田电力-2023-naist10.18653/v1/2023.iwslt-1.31<位置><网址>https://aclantology.org/2023.iwslt-1.31</url></位置><部分>2023-07年<扩展单元=“page”><开始>330<end>340</范围></部分></mods></modsCollection>
%0会议记录%T NAIST IWSLT 2023同步语音转换系统%A福田,Ryo%西川,尤塔%阿卡诺,Yasumasa%阿科,尤卡%A Yanagita、Tomoya%Kosuke阿多%马纳,马基奈%萨克提,萨克里亚尼%胜本·A Sudoh%A中村,Satoshi%Y Salesky,伊丽莎白%Y Federico,马塞洛%Y Carpuat,海军%第20届国际口语翻译会议(IWSLT 2023)%D 2023年%7月8日%计算语言学协会%C加拿大多伦多(同人和在线)%福田电气-2023-naist%X本文描述了NAIST提交给IWSLT 2023同步语音翻译任务的情况:英语到德语、日语、汉语演讲到文本翻译和英语到日语演讲到语音翻译。我们的语音到文本系统使用基于大规模预训练语音和文本模型的端到端多语言语音翻译模型。我们在模型中添加了互连,以合并预训练语音模型中间层的输出,并使用双语前缀对齐来增加前缀到前缀的文本数据,以增强离线语音翻译模型的同时性。我们的语音转换系统采用了一个增量文本语音模块,该模块由日语发音估计模型、声学模型和神经声码器组成。%R10.18653/v1/2023.iwslt-1.31%U型https://aclantology.org/2023.iwslt-1.31%U型https://doi.org/10.18653/v1/2023.iwslt-1.31%第330-340页
降价(非正式)
[IWSLT 2023的NAIST同步语音转换系统](https://aclantology.org/2023.iwslt-1.31)(福田等人,IWSLT 2023)
国际计算语言学协会
- 福田良彦、西川由塔、卡诺靖久、高裕嘉、柳田富也、小久弥、马纳牧野、坂崎、铃木和中村佐治。2023用于IWSLT 2023的NAIST同步语音转换系统.英寸第20届国际口语翻译大会(IWSLT 2023)会议记录,第330–340页,加拿大多伦多(个人和在线)。计算语言学协会。