@正在进行{jayanthi-etal-2023检索,title=“检索和复制:将{ASR}个性化扩展到大型目录”,author=“贾扬蒂、赛·穆拉利达尔和Kulshreshtha、Devang和丁利瓦尔、萨基特和Ronanki、Srikanth和斯拉文博达帕蒂”,editor=“王、明轩和伊梅德·齐图尼“,booktitle=“2023年自然语言处理实证方法会议记录:行业轨迹”,月=12月,年=“2023”,address=“新加坡”,publisher=“计算语言学协会”,url=“https://aclantology.org/2023.emnlp-industry.60”,doi=“10.18653/v1/2023.emnlp-industry.60”,pages=“631--639”,abstract=“自动语音识别(ASR)的个性化模型是一个广泛研究的课题,因为它有许多实际应用。最近,基于注意的上下文偏向技术被用于提高对罕见单词和/或特定领域实体的识别。然而,由于性能限制,偏差通常仅限于几千个实体,限制了真实世界的可用性。为了解决这个问题,我们首先提出了一种{`}检索和复制{''}机制,以提高延迟,同时即使在扩展到大型目录时也能保持准确性。我们还提出了一种培训策略,以克服由于混淆实体数量增加而导致的大规模召回率下降。总的来说,与强大的基线相比,我们的方法在F1中实现了最多6{\%}的字错误率减少(WERR)和3.6{\%neneneep的绝对改进。我们的方法还允许大的目录大小达到20K,而不会显著影响WER和F1核,同时每个声学帧至少实现20{\%}推理加速。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“jayanthi-etal-2023-retrieve”><标题信息>检索和复制:将ASR个性化扩展到大型目录</titleInfo><name type=“个人”><namePart type=“给定”>Sai</namePart>穆拉利达尔Jayanthi<角色>作者</角色></name><name type=“个人”><namePart type=“given”>Devang开发库尔什什塔<角色>作者</角色></name><name type=“个人”>Saket系列丁利瓦尔<角色>作者</角色></name><name type=“个人”>Srikanth公司罗南基<角色>作者</角色></name><name type=“个人”>斯拉文博达帕蒂<角色>作者</角色></name><originInfo>2023-12年发布</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息>2023年自然语言处理实证方法会议记录:行业跟踪</titleInfo><name type=“个人”>明轩王<namePart type=“family”><角色>编辑器</角色></name><name type=“个人”><namePart type=“given”>我是Zitouni公司<角色>编辑器</角色></name><originInfo><publisher>计算语言学协会</publisher><位置>新加坡</place></originInfo>会议出版物</relatedItem>自动语音识别(ASR)模型的个性化由于其许多实际应用而成为一个广泛研究的主题。最近,基于注意力的上下文偏置技术被用来提高对稀有单词和/或领域特定实体的识别。然而,由于性能限制,偏差通常仅限于几千个实体,限制了真实世界的可用性。为了解决这个问题,我们首先提出了一种“检索和复制”机制,以改进延迟,同时即使在扩展到大型目录时也能保持准确性。我们还提出了一种培训策略,以克服由于混淆实体数量增加而导致的大规模召回率下降。总的来说,与强大的基线相比,我们的方法在F1中实现了高达6%的字错误率减少(WERR)和3.6%的绝对改进。我们的方法还允许大的目录大小达到20K,而不会显著影响WER和F1核,同时每个声帧至少实现20%的推理加速</摘要>jayanthi-etal-2023-检索10.18653/v1/2023.emnlp-industry.60<位置><网址>https://aclantology.org/2023.emnlp-industry.60</url></位置><部分><日期>2023-12年</日期><扩展单元=“page”><开始>631</开始><end>639</范围></部分></mods></modsCollection>
%0会议记录%检索和复制:将ASR个性化扩展到大型目录%A Jayanthi,Sai Muralidhar%A Kulshreshtha,德旺%阿丁利瓦尔,萨科特%A Ronanki,Srikanth%A Bodapati,斯拉文%Y Wang、Mingxuan%伊梅德·齐图尼%2023年自然语言处理实证方法会议论文集:行业跟踪%D 2023年%12月8日%计算语言学协会%C新加坡%F jayanthi-etal-2023检索%X自动语音识别(ASR)模型的个性化是一个广泛研究的课题,因为它有许多实际应用。最近,基于注意的上下文偏向技术被用于提高对罕见单词和/或特定领域实体的识别。然而,由于性能限制,偏差通常仅限于几千个实体,限制了真实世界的可用性。为了解决这个问题,我们首先提出了一种“检索和复制”机制,以改进延迟,同时即使在扩展到大型目录时也能保持准确性。我们还提出了一种培训策略,以克服由于混淆实体数量增加而导致的大规模召回率下降。总的来说,与强大的基线相比,我们的方法在F1中实现了高达6%的字错误率减少(WERR)和3.6%的绝对改进。我们的方法还允许大的目录大小达到20K,而不会显著影响WER和F1核,同时每个声帧至少实现20%的推理加速。%R 10.18653/v1/2023.emnlp-industry.60%U型https://acl选集.org/2023.emnlp-industry.60%U型https://doi.org/10.18653/v1/2023.emnlp-industry.60%电话631-639
降价(非正式)
[检索和复制:将ASR个性化扩展到大型目录](https://aclantology.org/2023.emnlp-industry.60)(Jayanthi等人,EMNLP 2023)
国际计算语言学协会
- Sai Muralidhar Jayanthi、Devang Kulshreshtha、Saket Dingliwal、Srikanth Ronanki和Sravan Bodapati。2023检索和复制:将ASR个性化扩展到大型目录.英寸2023年自然语言处理实证方法会议记录:行业跟踪,第631-639页,新加坡。计算语言学协会。