@进行中{zhang-etal-2023-高效,title=“通过粗标签对端到端语音翻译进行高效{CTC}正则化”,author=“张彪哈多、巴里和里科·森里奇“,editor=“弗拉乔斯、安德烈亚斯和伊莎贝尔·奥根斯坦“,booktitle=“计算语言学协会欧洲分会第17届会议记录”,月=5月,年份=“2023”,address=“克罗地亚杜布罗夫尼克”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.eacl-main.166”,doi=“10.18653/v1/2023.eacl-main.166”,pages=“2264--2276”,abstract=“对于端到端语音翻译,使用连接时态分类(CTC)规范编码器目的使用源转录本或目标翻译作为标签可以大大提高质量。然而,CTC要求在词汇表空间上增加一个预测层,带来了不可忽略的模型参数和计算开销,尽管该层在推理方面变得毫无用处。在本文中,我们重新审视了CTC对真正的词汇标签进行规范化的必要性,并探索了减少CTC标签空间的策略,以期在不降低质量的情况下提高效率。我们提出了粗标注CTC(CoLaCTC),它通过简单的启发式规则合并词汇标签,例如使用截断、除法或模(MOD)操作。尽管它很简单,但我们在4种源语言和8种目标语言上的实验表明,使用MOD的CoLaCTC可以将标签空间大幅压缩到256,甚至更进一步,从而提高了训练效率(1.18{但仍能提供与CTC基准相当或更好的性能。我们还表明,CoLaCTC成功地推广到CTC正则化,而不考虑使用转录或翻译进行标记。",}
<?xml版本=“1.0”编码=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“zhang-etal-2023-高效”><标题信息><title>通过粗标签对端到端语音翻译进行高效CTC正则化</titleInfo><name type=“personal”><namePart type=“given”>彪<namePart type=“family”>张<角色>作者</角色></name><name type=“personal”>巴里哈多<角色>作者</角色></name><name type=“personal”>Rico(Rico)Sennrich<角色>作者</角色></name><originInfo>发布日期:2023-05发布日期:</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>计算语言学协会欧洲分会第17届会议记录</titleInfo><name type=“personal”>安德烈亚斯Vlachos公司<角色>编辑器</角色></name><name type=“personal”>伊莎贝尔奥根斯坦<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>克罗地亚杜布罗夫尼克</place></originInfo>会议出版物</relatedItem><abstract>对于端到端的语音翻译,使用源文本或目标翻译作为标签,使用连接时态分类(CTC)目标规范编码器可以大大提高质量。然而,CTC要求在词汇表空间上增加一个预测层,带来了不可忽略的模型参数和计算开销,尽管该层在推理方面变得毫无用处。在本文中,我们重新审视了CTC对真正的词汇标签进行规范化的必要性,并探索了减少CTC标签空间的策略,以期在不降低质量的情况下提高效率。我们提出了粗标注CTC(CoLaCTC),它通过简单的启发式规则合并词汇标签,例如使用截断、除法或模(MOD)操作。尽管它很简单,但我们在4种源语言和8种目标语言上的实验表明,使用MOD的CoLaCTC可以将标签空间大幅压缩到256甚至更进一步,从而获得训练效率(根据原始词汇大小,速度提高1.18倍~1.77倍)但仍能提供与CTC基准相当或更好的性能。我们还表明,CoLaCTC成功地推广到CTC正则化,而不考虑使用转录或翻译进行标记</摘要>zhang-etal-2023-高效10.18653/v1/2023.eacl-main.166<位置><网址>https://aclantology.org/2023.eacl-main.166</url></位置><部分>2023-05年<扩展单元=“page”><开始>2264</开始><end>2276</范围></部分></mods></modsCollection>
%0会议记录%基于粗标签的高效CTC正则化在端到端语音翻译中的应用%张彪%巴里,阿哈多%A Sennrich,里科%安德烈亚斯·瓦拉科斯%伊莎贝尔·Y·奥根斯坦%计算语言学协会欧洲分会第17届会议记录%D 2023年%5月8日%计算语言学协会%C杜布罗夫尼克,克罗地亚%F zhang-etal-2023高效%X对于端到端的语音翻译,使用源文本或目标翻译作为标签,使用连接时态分类(CTC)目标规范编码器可以大大提高质量。然而,CTC要求在词汇表空间上增加一个预测层,带来了不可忽略的模型参数和计算开销,尽管该层在推理方面变得毫无用处。在本文中,我们重新审视了CTC对真正的词汇标签进行规范化的必要性,并探索了减少CTC标签空间的策略,以期在不降低质量的情况下提高效率。我们提出了粗标注CTC(CoLaCTC),它通过简单的启发式规则合并词汇标签,例如使用截断、除法或模(MOD)操作。尽管它很简单,但我们在4种源语言和8种目标语言上的实验表明,使用MOD的CoLaCTC可以将标签空间大幅压缩到256甚至更进一步,从而获得训练效率(根据原始词汇大小,速度提高1.18倍~1.77倍)但仍能提供与CTC基准相当或更好的性能。我们还表明,CoLaCTC成功地推广到CTC正则化,而不考虑使用转录或翻译进行标记。%R 10.18653/v1/2023.eacl最小值166%U型https://aclantology.org/2023.eacl-main.166%U型https://doi.org/10.18653/v1/2023.eacl-main.166%电话:2264-2276
降价(非正式)
[通过粗标签对端到端语音翻译进行高效CTC正则化](https://aclantology.org/2023.eacl-main.166)(Zhang等人,EACL 2023)
国际计算语言学协会
- 张彪(Biao Zhang)、巴里·哈多(Barry Haddow)和里科·森里奇(Rico Sennrich)。2023基于粗标签的高效CTC正则化在端到端语音翻译中的应用.英寸计算语言学协会欧洲分会第17届会议论文集第2264-2276页,克罗地亚杜布罗夫尼克。计算语言学协会。