SpeechBrain公司 swMATH ID: 39129 软件作者: 米尔科·拉瓦内利;Titouan Parcollet;等 描述: SpeechBrain:通用语音工具包。SpeechBrain是一个开源的多功能语音工具包。它的设计目的是通过简单、灵活、用户友好和文档丰富来促进神经语音处理技术的研究和开发。本文描述了为支持几个共同感兴趣的任务而设计的核心架构,允许用户自然地构思、比较和共享新颖的语音处理管道。SpeechBrain在广泛的语音基准测试中取得了具有竞争力或最先进的性能。它还为流行的语音数据集提供训练配方、预训练模型和推理脚本,以及教程,让任何精通Python的人都能熟悉语音技术。 主页: https://speechbrain.github.io 源代码: https://github.com/speechbrain/speechbrain网址 依赖项: 蟒蛇;PyTorch公司 关键词: 音频;语音处理;arXiv_eess(_E)。AS公司;人工智能;arXiv(cs.AI;机器学习;arXiv_cs。LG公司;声音;arXiv_cs。标准偏差;演讲大脑;PyTorch公司 相关软件: 波浪2vec;自由演讲;PyTorch-Kaldi公司;NeMo公司;费尔塞克;意大利浓咖啡;ESPnet公司;小行星;TensorFlow公司;PyTorch公司;蟒蛇;深度演讲;塔斯奈特;波浪辉光;wav2字母++;胡伯特;驾驶员侧车门开关总成;利比亚ROSA;数字Py;托沙迪奥 引用于: 0个文档 标准条款 1出版物描述软件 年份 SpeechBrain:通用语音工具包arXiv公司米尔科·拉瓦内利;Titouan Parcollet;等 2021