×

SpecAugment公司

swMATH编号: 37168
软件作者: Daniel S.Park、William Chan、Yu Zhang、Chung-Cheng Chiu、Barret Zoph、Ekin D.Cubuk、Quoc V.Le
描述: SpecAugment:一种用于自动语音识别的简单数据增强方法。我们提出了一种简单的语音识别数据增强方法SpecAugment。SpecAugment直接应用于神经网络的特征输入(即滤波器组系数)。增强策略包括扭曲特征、屏蔽频率通道块和屏蔽时间步长块。我们将SpecAugment应用于侦听、参与和拼写网络,以完成端到端的语音识别任务。我们在LibriSpeech 960h和Swichboard 300h任务上实现了最先进的性能,超过了所有之前的工作。在Libri语音上,我们达到了6.8
主页: https://arxiv.org/abs/1904.08779
源代码:  https://github.com/pyyush/SpecAugment网站
关键词: 音频处理;语音处理;arXiv_eess(_E)。AS公司;arXiv_cs。;机器学习;arXiv_cs。LG公司;arXiv_cs。标准偏差;arXiv_状态ML;端到端语音识别
相关软件: 蟒蛇;ESPnet公司;PyTorch公司;MixMatch(混合匹配);自动增强;ImageNet公司;AugMix公司;亚当;新加坡存托凭证;塔达姆;S4L系列;混淆;随机增强;重新混合匹配;CIFAR公司;修复匹配;费尔塞克;灵沃;意大利浓咖啡;PyTorch-Kaldi公司
引用于: 0个文档