@正在进行{duquenne-etal-2023-speechmatrix,title=“{S}peech{M}atrix:多语言语音转换的大规模挖掘语料库”,author=“Duquenne、Paul-Ambroise和龚宏宇和Dong、Ning和杜景飞和Lee、Ann和Goswami、Vedanuj和王长汉和皮诺、胡安和萨戈、贝诺和霍尔格·施温克”,editor=“罗杰斯、安娜和Boyd-Graber、Jordan和冈崎,直木“,booktitle=“计算语言学协会第61届年会会议记录(第1卷:长篇论文)”,月=七月,年=“2023”,address=“加拿大多伦多”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.acl-long.899”,doi=“10.18653/v1/2023.acl长.899”,pages=“16251--16269”,抽象=“我们展示了SpeechMatrix,这是一个大规模的多语种演讲翻译语料库,它是从欧洲议会录音的真实演讲中挖掘出来的。它包含136个语言对的语音对齐,总共41.8万小时的演讲。为了评估这种并行演讲的质量,我们训练双语演讲翻译模块els,并在EuroParl ST、VoxPopuli和FLEURS测试集上建立广泛的基线结果。借助SpeechMatrix的多语言性,我们还探索了多语言语音翻译,这是一个很少有其他作品涉及的主题。我们还证明了使用混合专家进行模型预训练和稀疏缩放可以大大提高翻译性能。挖掘的数据和模型将公开发布”,}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“duquenne-etal-2023-speechmatrix”><标题信息>SpeechMatrix:多语言语音转换的大规模挖掘语料库</titleInfo><name type=“personal”><namePart type=“given”>Paul Ambroise</namePart>杜昆(Duquenne)<角色>作者</角色></name><name type=“personal”>宏宇<namePart type=“given”>龚<角色>作者</角色></name><name type=“personal”><namePart type=“given”>宁</namePart>侗族<角色>作者</角色></name><name type=“personal”>景飞<namePart type=“given”>杜氏<角色>作者</角色></name><name type=“personal”>安李<namePart type=“family”><角色>作者</角色></name><name type=“personal”>韦达努吉戈斯瓦米<角色>作者</角色></name><name type=“personal”>长汉王<namePart type=“family”><角色>作者</角色></name><name type=“personal”>胡安皮诺<角色>作者</角色></name><name type=“个人”><namePart type=“given”>贝诺Sagot系列<角色>作者</角色></name><name type=“personal”>霍尔格Schwenk(施文克)<角色>作者</角色></name><originInfo>发布日期:2023-07发布日期:</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>计算语言学协会第61届年会会议记录(第1卷:长篇论文)</titleInfo><name type=“personal”>安娜罗杰斯<角色>编辑器</角色></name><name type=“个人”>约旦博伊德·格雷伯<角色>编辑器</角色></name><name type=“personal”>Naoaki(Naoaki)冈崎<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>加拿大多伦多</地点></originInfo>会议出版物</relatedItem>我们展示了SpeechMatrix,这是一个大规模的多语言语料库,它是从欧洲议会录音的真实演讲中挖掘出来的演讲翻译。它包含136个语言对的语音对齐,总共41.8万小时的语音。为了评估这种并行语音的质量,我们仅对挖掘的数据训练双语语音转换模型,并在EuroParl-ST、VoxPopuli和FLEURS测试集上建立广泛的基线结果。借助SpeechMatrix的多语言性,我们还探索了多语言语音翻译,这是一个很少有其他作品涉及的主题。我们还证明了使用混合专家进行模型预训练和稀疏缩放可以大大提高翻译性能。挖掘的数据和模型将公开发布duquenne-etal-2023-speechmatrix公司10.18653/v1/2023.acl-long.899<位置><网址>https://aclantology.org/2023.acl-long.899</url></位置><部分>2023-07年<扩展单元=“page”><开始>16251<end>16269</end></范围></部分></mods></modsCollection>
%0会议记录%T SpeechMatrix:多语言语音翻译的大规模挖掘语料库%A Duquenne,Paul-Ambroise保罗·安布罗斯%阿贡、洪宇%阿东、宁%阿杜、景飞%A Lee,Ann(安·李)%阿戈斯瓦米,韦达努伊%A Wang,长汉%胡安·皮诺%西红柿,贝诺%霍尔格·施温克%安娜·罗杰斯%Y Boyd-Graber,约旦%Y冈崎,直崎%计算语言学协会第61届年会论文集(第一卷:长篇论文)%D 2023年%7月8日%计算语言学协会%C加拿大多伦多%F duquenne-etal-2023-语音矩阵%X我们展示了SpeechMatrix,这是一个大规模的多语言语料库,其中包含了从欧洲议会录音的真实演讲中提取的演讲翻译。它包含136个语言对的语音对齐,总共41.8万小时的语音。为了评估这种并行语音的质量,我们仅对挖掘的数据训练双语语音转换模型,并在EuroParl-ST、VoxPopuli和FLEURS测试集上建立广泛的基线结果。借助SpeechMatrix的多语言性,我们还探索了多语言语音翻译,这是一个很少有其他作品涉及的主题。我们还证明了使用混合专家进行模型预训练和稀疏缩放可以大大提高翻译性能。挖掘的数据和模型将公开发布%R 10.18653/v1/2023.acl长899%单位https://aclantology.org/2023.acl-long.899%单位https://doi.org/10.18653/v1/2023.acl-long.899%电话:16251-16269
降价(非正式)
[SpeechMatrix:多语言语音转换的大规模挖掘语料库](https://aclantology.org/2023.acl-long.899)(Duquenne等人,ACL 2023)
国际计算语言学协会
- 保罗·安布罗西·杜昆(Paul-Ambroise Duquenne)、龚红玉(Hongyu Gong)、董宁(Ning Dong)、杜敬飞(Jingfei Du)、李安(Ann Lee)、韦达努吉·戈斯瓦米(Vedanuj Goswami)、王长汉(Changhan Wang)、胡安·皮诺(Juan。2023SpeechMatrix:多语言语音翻译的大规模挖掘语料库.英寸计算语言学协会第61届年会论文集(第一卷:长篇论文),第16251–16269页,加拿大多伦多。计算语言学协会。