×

Py链

swMATH ID: 35385
软件作者: 邵一文、王一鸣、丹尼尔·波维、桑吉夫·库丹普尔
描述: PyChain:用于端到端ASR的LF-MMI的完全并行PyTorch实现。我们提出了PyChain,它是Kaldi自动语音识别(ASR)工具包中所谓的emph{chain模型}的端到端无网格最大互信息(LF-MMI)训练的完全并行化PyTorch实现。与其他基于PyTorch和Kaldi的ASR工具包不同,PyChain被设计为尽可能灵活和轻量级,以便可以轻松地插入到新的ASR项目或其他基于Py Torch的现有ASR工具中,分别以新项目PyChain-example和现有的端到端ASR工具包Espresso为例。PyChain的效率和灵活性通过分子/分母图上的全GPU训练以及对不等长度序列的支持等新颖功能得到了证明。WSJ数据集上的实验表明,使用简单的神经网络和常用的机器学习技术,PyChain可以获得与Kaldi相当的竞争结果,并且优于其他端到端ASR系统。
主页: https://arxiv.org/abs/2005.09824
源代码:  https://github.com/YiwenShaoStephen/pychain网站
关键词: 音频和语音处理(eess.AS)计算与语言(cs.CL)声音(cs.SD)端到端语音识别无晶格MMIPyTorch公司柯迪
相关软件: 柯迪自由演讲亚当pybind11蛋白皮卡迪PyTorch公司Pkwrap公司
引用于: 0个文档