计算机科学>声音
标题: 基于无监督纠错的语音识别无监督域自适应
摘要: 当转录来自未知域的音频时,自动语音识别(ASR)系统的转录质量会显著降低。 我们提出了一种用于无监督ASR域自适应的无监督错误纠正方法,旨在恢复由域失配引起的转录错误。 与依赖转录音频进行训练的现有校正方法不同,我们的方法只需要目标域的未标记数据,其中应用伪标记技术来生成校正训练样本。 为了减少对伪数据的过度拟合,我们还提出了一个编码器-解码器校正模型,该模型可以考虑对话上下文和声学特征等附加信息。 实验结果表明,与非自适应ASR系统相比,该方法可以显著降低误码率。 该修正模型也可以应用于其他适应方法之上,从而带来10%的相对额外改进。