@在过程中{merz-scrivner-2022-descourse,title=“关于{ASR}测量的讨论:介绍{ARPOCA}评估工具”,author=“Merz、Megan和奥尔加·斯克里夫纳”,editor=“Louvan、Samuel和马多托、安德里亚和布赖伦·马杜雷拉”,booktitle=“计算语言学协会第60届年会会议记录:学生研究研讨会”,月=5月,年=“2022”,address=“爱尔兰都柏林”,publisher=“计算语言学协会”,url=“https://aclantology.org/2022.acl-srw.28”,doi=“10.18653/v1/2022.acl-srw.28”,pages=“366--372”,abstract=“自动语音识别(ASR)已经从带有发音字典、语音特征和语言模型的管道体系结构发展到端到端系统,该系统执行从原始波形到单词序列的直接翻译。随着准确度的提高和预训练模型的可用性,ASR系统现在在我们的日常应用中无处不在。另一方面,模型的可解释性及其计算成本变得更具挑战性,尤其是在处理不太常见的语言或识别说话人的区域差异时。本研究方案将遵循四个阶段的过程:1)证明声学特征和特征提取算法的概述;2) 探索当前的ASR模型、工具和性能评估技术;3) 将特征与可解释的语音记录对齐;和4)设计原型ARPOCA,通过使用PRAAT和语音转录开发半自动声学特征提取,提高对区域语言变化的认识,并改进模型反馈。",}
<?xml version=“1.0”encoding=“UTF-8”?><modsCollection xmlns=“http://www.loc.gov/mods/v3"><mods ID=“merz-scrivner-2022-discussion”><标题信息>关于ASR测量的讨论:介绍ARPOCA评估工具</titleInfo><name type=“personal”>梅根梅尔兹<角色>作者</角色></name><name type=“personal”>奥尔加Scrivner<角色>作者</角色></name><originInfo>2022-05发布日期</originInfo><typeOfResource>文本<relatedItem type=“主机”><标题信息><title=计算语言学协会第60届年会论文集:学生研究研讨会</title=</titleInfo><name type=“personal”>塞缪尔楼房<namePart type=“family”><角色>编辑器</角色></name><name type=“personal”>安德里亚马多托<角色>编辑器</角色></name><name type=“personal”>布里伦马杜雷拉<角色>编辑器</角色></name><originInfo>计算语言学协会<位置>爱尔兰都柏林</place></originInfo>会议出版物</relatedItem>自动语音识别(ASR)已经从带有发音字典、语音特征和语言模型的流水线体系结构发展到了端到端系统,它可以将原始波形直接转换为单词序列。随着预训练模型的准确性和可用性的提高,ASR系统现在在我们的日常应用中无处不在。另一方面,模型的可解释性和计算成本变得更具挑战性,尤其是在处理不太常见的语言或识别说话人的区域差异时。本研究方案将遵循四个阶段的过程:1)证明声学特征和特征提取算法的概述;2) 探索当前的ASR模型、工具和性能评估技术;3) 将特征与可解释的语音记录对齐;和4)设计原型ARPOCA,通过使用PRAAT和语音转录开发半自动声学特征提取,提高对区域语言变化的认识,并改进模型反馈</摘要>merz-scrivner-2022语篇10.18653/v1/2022.acl-srw.28<位置><网址>https://aclantology.org/2022.acl-srw.28</url></位置><部分>2022-05年<扩展单元=“page”><开始>366<end>372</范围></部分></mods></modsCollection>
%0会议记录%关于ASR测量的讨论:介绍ARPOCA评估工具%梅根,A Merz%奥尔加·A Scrivner%Y Louvan,塞缪尔%安德烈亚·马多托%布里埃伦·Y·马杜雷拉%计算语言学协会第60届年会论文集:学生研究研讨会%D 2022年%5月8日%计算语言学协会%C都柏林,爱尔兰%F merz-scrivner-2022话语%X自动语音识别(ASR)已经从带有发音字典、语音特征和语言模型的流水线体系结构发展到端到端系统,该系统执行从原始波形到单词序列的直接翻译。随着准确度的提高和预训练模型的可用性,ASR系统现在在我们的日常应用中无处不在。另一方面,模型的可解释性和计算成本变得更具挑战性,尤其是在处理不太常见的语言或识别说话人的区域差异时。本研究方案将遵循四个阶段的过程:1)证明声学特征和特征提取算法的概述;2) 探索当前的ASR模型、工具和性能评估技术;3) 将特征与可解释的语音记录对齐;以及4)设计原型ARPOCA,以通过结合语音转录使用PRAT开发半自动声学特征提取来提高对区域语言变异的认识并改进模型反馈。%R 10.18653/v1/2022.acl-srw.28号%U型https://aclantology.org/2022.acl-srw.28%U型https://doi.org/10.18653/v1/2022.acl-srw.28%电话366-372
降价(非正式)
【关于ASR测量的讨论:介绍ARPOCA评估工具】(https://aclantology.org/2022.acl-srw.28)(Merz&Scrivner,ACL 2022)
国际计算语言学协会