Discourse on ASR Measurement: Introducing the ARPOCA Assessment Tool

Megan Merz; Olga Scrivner

doi:10.18653/v1/2022.acl-srw.28

关于语音识别测量：介绍ARPOCA公司评估工具

摘要

自动语音识别（ASR）已经从带有发音字典、语音特征和语言模型的流水线体系结构发展到端到端系统，该系统执行从原始波形到单词序列的直接翻译。随着准确度的提高和预训练模型的可用性，ASR系统现在在我们的日常应用中无处不在。另一方面，模型的可解释性和计算成本变得更具挑战性，尤其是在处理不太常见的语言或识别说话人的区域差异时。本研究方案将遵循四个阶段的过程：1）证明声学特征和特征提取算法的概述；2）探索当前的ASR模型、工具和性能评估技术；3）将特征与可解释的语音记录对齐；和4）设计原型ARPOCA，通过使用PRAAT和语音转录开发半自动声学特征提取，提高对区域语言变化的认识，并改进模型反馈。

选集ID：: 2022.acl-srw.28年
体积：: 计算语言学协会第60届年会会议记录：学生研究研讨会
月份：: 五月
年份：: 2022
地址：: 爱尔兰都柏林
编辑：: 塞缪尔·卢万,安德烈亚·马多托,布莱伦·马杜雷拉
地点：: 国际计算语言学协会
SIG公司：
出版商：: 计算语言学协会
注：
页：: 366–372
语言：
网址：: https://aclantology.org/2022.acl-srw.28
DOI（操作界面）：: 10.18653/v1/2022.acl-srw.28
比比键：
引用（ACL）：: 梅根·默兹和奥尔加·斯克里夫纳。2022关于ASR测量的讨论：介绍ARPOCA评估工具.英寸计算语言学协会第60届年会论文集：学生研究研讨会，第366–372页，爱尔兰都柏林。计算语言学协会。
引用（非正式）：: 关于ASR测量的讨论：介绍ARPOCA评估工具（Merz&Scrivner，ACL 2022）
复制引文：
PDF格式：: https://aclantology.org/2022.acl-srw.28.pdf
视频：: https://aclantology.org/2022.acl-srw.28.mp4

PDF格式引用搜索视频