×

openSMILE(打开微笑)

swMATH编号: 21623
软件作者: F.Eyben、F.Weninger、F.Gro、B.Schuller
描述: 慕尼黑开源多媒体功能提取器openSMILE的最新发展。我们介绍openSMILE特征提取工具包的最新开发。2.0版现在将语音、音乐和一般声音事件的特征提取范式与用于多模式处理的基本视频特征相结合。音频和视频中的描述符可以在单个框架中联合处理,允许参数的时间同步、在线增量处理以及离线和批处理,并提取统计函数(特征摘要),例如矩、峰值、回归参数等。特征的后处理包括统计分类器,如支持向量机模型或流行工具包(如Weka或HTK)的文件导出。可用的低级描述符包括流行的语音、音乐和视频特征,包括Mel-frequency和类似倒谱和频谱系数、Chroma、CENS、基于听觉模型的响度、语音质量、局部二进制模式、颜色和光流直方图。此外,还支持语音活动检测、基音跟踪和人脸检测。openSMILE是在C++中实现的,使用标准开源库进行在线音频和视频输入。它速度快,在Unix和Windows平台上运行,并且具有模块化、基于组件的体系结构,可以通过插件轻松进行扩展。openSMILE 2.0是根据研究许可证发布的,可以从以下站点下载http://opensmile.sourceforge.net/。
主页: http://audering.com/technology/opensile/
相关软件: 科学Py;利比亚;皮斯普特克;SPTK公司;MIR工具箱;Troparion公司;自由演讲;语音信箱;Matlab公司;普拉特;PyTorch公司;TensorFlow公司;Scikit公司;蟒蛇;冲浪板;威卡;LIBLINEAR银行;k平均值++;伦敦银行支持向量机;打开XBOW
引用于: 2文件

2篇连载文章中引用

1 富兰克林学院学报
1 斯普林格论文

按年份列出的引文