软件搜索-zbMATH Open

SpecAugment公司

swMATH编号：	37168
软件作者：	Daniel S.Park、William Chan、Yu Zhang、Chung-Cheng Chiu、Barret Zoph、Ekin D.Cubuk、Quoc V.Le
描述：	SpecAugment：一种用于自动语音识别的简单数据增强方法。我们提出了一种简单的语音识别数据增强方法SpecAugment。SpecAugment直接应用于神经网络的特征输入（即滤波器组系数）。增强策略包括扭曲特征、屏蔽频率通道块和屏蔽时间步长块。我们将SpecAugment应用于侦听、参与和拼写网络，以完成端到端的语音识别任务。我们在LibriSpeech 960h和Swichboard 300h任务上实现了最先进的性能，超过了所有之前的工作。在Libri语音上，我们达到了6.8
主页：	https://arxiv.org/abs/1904.08779
源代码：	https://github.com/pyyush/SpecAugment网站
关键词：	音频处理;语音处理;arXiv_eess（_E）。AS公司;arXiv_cs。氯;机器学习;arXiv_cs。LG公司;arXiv_cs。标准偏差;arXiv_状态ML;端到端语音识别
相关软件：	蟒蛇;ESPnet公司;PyTorch公司;MixMatch（混合匹配）;自动增强;ImageNet公司;AugMix公司;亚当;新加坡存托凭证;塔达姆;S4L系列;混淆;随机增强;重新混合匹配;CIFAR公司;修复匹配;费尔塞克;灵沃;意大利浓咖啡;PyTorch-Kaldi公司
引用于：	0个文档