关于语音识别测量:介绍ARPOCA公司评估工具

梅根·默兹,奥尔加·斯克里夫纳


摘要
自动语音识别(ASR)已经从带有发音字典、语音特征和语言模型的流水线体系结构发展到端到端系统,该系统执行从原始波形到单词序列的直接翻译。随着准确度的提高和预训练模型的可用性,ASR系统现在在我们的日常应用中无处不在。另一方面,模型的可解释性和计算成本变得更具挑战性,尤其是在处理不太常见的语言或识别说话人的区域差异时。本研究方案将遵循四个阶段的过程:1)证明声学特征和特征提取算法的概述;2) 探索当前的ASR模型、工具和性能评估技术;3) 将特征与可解释的语音记录对齐;和4)设计原型ARPOCA,通过使用PRAAT和语音转录开发半自动声学特征提取,提高对区域语言变化的认识,并改进模型反馈。
选集ID:
2022.acl-srw.28年
体积:
计算语言学协会第60届年会会议记录:学生研究研讨会
月份:
五月
年份:
2022
地址:
爱尔兰都柏林
编辑:
塞缪尔·卢万,安德烈亚·马多托,布莱伦·马杜雷拉
地点:
国际计算语言学协会
SIG公司:
出版商:
计算语言学协会
注:
页:
366–372
语言:
网址:
https://aclantology.org/2022.acl-srw.28
DOI(操作界面):
10.18653/v1/2022.acl-srw.28
比比键:
引用(ACL):
梅根·默兹和奥尔加·斯克里夫纳。2022关于ASR测量的讨论:介绍ARPOCA评估工具.英寸计算语言学协会第60届年会论文集:学生研究研讨会,第366–372页,爱尔兰都柏林。计算语言学协会。
引用(非正式):
关于ASR测量的讨论:介绍ARPOCA评估工具(Merz&Scrivner,ACL 2022)
复制引文:
PDF格式:
https://aclantology.org/2022.acl-srw.28.pdf
视频:
 https://aclantology.org/2022.acl-srw.28.mp4