此页面已弃用。请在上查找最新版本github.

RWTH ASR-RWTH亚琛大学语音识别系统

RWTH ASR跑道

RWTH ASR(简称“RASR”)是一个软件包,包含语音识别解码器以及用于开发声学模型的工具,用于语音识别系统。自2001年以来,它一直由亚琛工业大学的人类语言技术和模式识别小组开发。使用该框架开发的语音识别系统已成功应用于多个国际研究项目和相应的评估。

RASR由几个用C++编写的库和工具组成。目前,支持Linux(x86和x86-64)和Mac OS X(Intel)平台。

功能

文档

RASR的开发正在进行中。手册可在RASR手册Wiki。访问wiki需要注册。

有关所用理论基础和方法的出版物可以在出版物页面。软件包的详细描述见Rybach等人。亚琛RWTH大学开源语音识别系统。2009年国际演讲.

以下是一个简短的介绍幻灯片.

请在中发布问题支持论坛.

安装

RASR仅以源代码形式提供。有关构建说明,请参阅附带的自述文件。

需要一组已安装的工具和库(括号中给出了Debian软件包名称):

使用条款

RASR是自由软件;它可以根据RWTH ASR许可证。本许可包括出于非商业目的的免费使用,只要对原始软件所做的任何更改是根据同一许可的条款发布的。其他许可证可以是请求.

下载

备注:不包括声学或语言模型。

要下载软件,您必须接受许可条款。请填写表格。提交的信息仅供内部使用,不会提供给第三方。

姓名:
组织机构:
电子邮件:
版本:
我同意
RWTH ASR许可证
我想使用文档wiki。用户名、密码和确认链接将发送到给定的电子邮件地址。
我想通过电子邮件接收有关RWTH ASR新版本的新闻。

系统演示

为了演示大型词汇系统,我们提供了以下为EPPS英语系统开发的模型(二进制格式),以及现成的一次通过识别设置:声学模型使用TC-STAR英语培训语料库.语言模型使用欧洲议会提供的最终文本版本以及声学训练数据的转录。

使用条款

所有提供的材料均可用于研究目的。禁止任何商业用途。不允许全部或部分分发所提供的数据。

通过使用原件或修改后的数据必须引用以下作者两份出版物:

J.Löf、C.Gollan、S.Hahn、G.Heigold、B.Hoffmeister、C.Plahl、,D.Rybach、R.Schlüter和H.Ney:“RWTH 2007 TC-STAR欧洲英语和西班牙语评估系统”Interspeech 2007,第2145-2148页,比利时安特卫普,2007年8月。

D.Rybach、S.Hahn、P.Lehnen、D.Nolden、M.Sundermeyer、Z.Tüske、S。Wiesler、R.Schlüter和H.Ney:“RASR-亚琛RWTH大学开源语音识别工具包”。IEEE自动语音认可与理解研讨会(ASRU),美国夏威夷,12月2011

要下载演示系统,请填写下表。我们将向您发送一封关于如何继续下载的电子邮件。

姓名:
组织机构:
地址:
城市:
国家/地区:
电子邮件:
我同意使用条款