Py链 swMATH ID: 35385 软件作者: 邵一文、王一鸣、丹尼尔·波维、桑吉夫·库丹普尔 描述: PyChain:用于端到端ASR的LF-MMI的完全并行PyTorch实现。我们提出了PyChain,它是Kaldi自动语音识别(ASR)工具包中所谓的emph{chain模型}的端到端无网格最大互信息(LF-MMI)训练的完全并行化PyTorch实现。与其他基于PyTorch和Kaldi的ASR工具包不同,PyChain被设计为尽可能灵活和轻量级,以便可以轻松地插入到新的ASR项目或其他基于Py Torch的现有ASR工具中,分别以新项目PyChain-example和现有的端到端ASR工具包Espresso为例。PyChain的效率和灵活性通过分子/分母图上的全GPU训练以及对不等长度序列的支持等新颖功能得到了证明。WSJ数据集上的实验表明,使用简单的神经网络和常用的机器学习技术,PyChain可以获得与Kaldi相当的竞争结果,并且优于其他端到端ASR系统。 主页: https://arxiv.org/abs/2005.09824 源代码: https://github.com/YiwenShaoStephen/pychain网站 关键词: 音频和语音处理(eess.AS);计算与语言(cs.CL);声音(cs.SD);端到端语音识别;无晶格MMI;PyTorch公司;柯迪 相关软件: 柯迪;自由演讲;亚当;pybind11蛋白;皮卡迪;PyTorch公司;Pkwrap公司 引用于: 0个文档