开源LVCSR软件(BSD 3条款许可证)。 基于二通策略的实时、高速、准确识别。 内存要求低:工作区所需的内存小于32MB(对于内存为3克LM的20k字听写,小于64MB)。 支持具有任意N的N-gram的LM。还支持基于规则的语法,以及用于孤立单词识别的单词列表。 语言和单位相关:可以使用ARPA标准格式的任何LM和HTK ascii hmm定义格式的AM。 高度可配置:可以设置各种搜索参数。 也可以选择替代解码算法(1-最佳/字对近似、字格/字图中间体等)。 支持的主要功能列表: 麦克风和网络输入的即时识别 基于GMM的输入抑制 连续解码,通过短暂停顿限定输入 N最佳输出 字图输出 单词、音素和状态级别上的强制对齐 置信度评分 服务器模式和控制API 许多搜索参数用于调整其性能 结果输出的字符代码转换。 (Rev.4)引擎成为库并提供简单的API (第4版)长N-gram支持 (版本4)仅以正向/反向N-gram运行 (第4版)混淆网络输出 (Rev.4)单线程中的任意多模型解码。 (修订版4)快速孤立词识别 (修订版4)用户定义的LM函数嵌入
基于DNN的解码,使用前端模块进行逐帧状态概率计算以获得灵活性。
%sudo apt-get安装build-essential zlib1g-dev libsdl2-dev libasound2-dev %git克隆 https://github.com/julius-speech/julius.git % 光盘 朱利叶斯 % ./ configure--启用-words-int %品牌-j4 %ls-l朱利叶斯 -rwxr-xr-x 1 ri实验室746056 5月26日13:01 julius/julius
% 光盘 .. %解压缩/some/where/ENVR-v5.4.Dnn。 箱子.zip % 光盘 ENVR-v5.4.Dnn.标准。 箱子
(编辑dnn.jconf) @@ -1,5 +1,5 @@ 特征类型MFCC_E_D_A_Z -feature_options-htkconf wav_config-cvn-cmnload ENVR-v5.3.normal-cmnstatic +feature_options-htkconf wav_config-cvn-cmnload ENVR-v5.3.normal-cvnstatic 线程数1 feature_len功能48 context_len 11 @@ -21,3 +21,4 @@ 输出_B ENVR-v5.3.layerout_bias.npy 状态优先级因子1.0 状态优先ENVR-v5.3之前 +state_prior_log10nite false
% ../ julius/julius/julius-C julius.jconf-dnnconf dnn.jconf
没有数据就说这篇文章没用 wseq1:<s>没有数据表示文章没有用处 phseq1:sil | w ih dh aw t | dh ax | d ae t ah | s eh d | dh iy | aa r t ah k ah l | w ax z | y uw s l ah s | sil cmscore1:0.785 0.892 0.318 0.284 0.669 0.701 0.818 0.103 0.528 1.000 得分1:261.947144
-输入麦克风 -htk转换wav_config -h ENVR-v5.3.am标准 -hlist ENVR-v5.3.phn -d ENVR-v5.3.lm标准 -v ENVR-v5.3.dct -b 4000人 -第12至6页 -lmp2 12-6 -后备1传球 -多路径 -综合工作计划 -iwcd1最大值 -sp模型sp -无CD -萼片150 -b2 360 -n 40号 -2000年 -8000米 -查找范围5 -某人80 -强迫
% ../ julius/julius/julius-C mic.jconf-dnnconf dnn.jconf
最新文档现在以降价形式提供于 文件/ . 所有选项在 选项 ,也列在示例配置文件中 样品.jconf ,在使用“julius--help”调用时也是输出。 完整历史记录和简短描述位于 发布说明 ( JP版本 ) 对于DNN-HMM,请查看 00自述-DNN.txt 如何操作和 样品.dnnconf 例如。
官方网站(日语) 旧开发网站,有旧版本 出版物: A.Lee和T.Kawahara。 “开源语音识别引擎Julius的最新发展”亚洲太平洋信号和信息处理协会年度峰会和会议(APSIPA ASC),2009年。 A.Lee、T.Kawahara和K.Shikano。 “Julius——一个开源实时大型词汇识别引擎。”。 欧洲语音通信与技术会议(EUROSPEECH),第1691-16942001页。 T.川原、A.李、T.小林、K.武田、N.Minematsu、S.佐山、K.伊藤、A.伊藤、M.山本、A.山田、T.Utsuro和K.Shikano。 “日语大词汇量连续语音识别的免费软件工具包”。 国际口语处理会议(ICSLP),第4卷,第476-4792000页。
A.Lee、T.Kawahara和K.Shikano。 “Julius——一个开源实时大型词汇识别引擎”。 程序中。 EUROSPEECH,第1691-16942001页。
A.Lee和T.Kawahara。 “开源语音识别引擎Julius的最新发展”亚洲太平洋信号和信息处理协会年度峰会和会议(APSIPA ASC),2009年。
A.Lee和T.Kawahara:Julius v4.5(2019) https://doi.org/10.5281/zenodo.2530395