国际标准协会 档案文件 2017年国际演讲
国际标准协会 档案文件 2017年国际演讲

基于DNN的儿童语音、寒战和打鼾识别特征提取和分类器组合

Gábor Gosztolya、Róbert Busa-Fekete、Tamás Grósz、LászlóTóth

在本研究中,我们处理了Interspeech的三个次级挑战2017年ComParE挑战赛,目标是确定以儿童为导向的说话、扬声器感冒以及不同类型的打鼾声。对于前两个子挑战,我们提出了一个简单的两步功能提取和分类方案:首先执行框架级通过深度神经网络(DNN)进行分类,然后我们提取来自DNN输出的话语水平特征。通过利用这些功能在分类方面,我们能够与标准的性能相匹配副语言方法(包括提取数千个特征,其中许多与实际任务完全无关)。至于打鼾小组挑战赛,我们把录音分成几段,并将一些框架级功能分段平均化然后用于话语级分类。当组合预测时提出的方法与标准副语言获得的方法方法,我们成功超越了Cold的基准值和隐藏测试集上的Snoring子挑战。


doi:10.21437/Interspeech.2017-905

引用:Gosztolya,G.,Busa-Fekete,R.,Grósz,T.,Tóth,L.(2017)基于DNN的特征提取和分类器组合,用于儿童定向语音、感冒和打鼾识别。程序。Interspeech 2017,3522-3526,doi:10.21437/Interspeech.2017-905

@在过程中{gosztolya7b_interspeech,author={Gábor Gosztolya和Róbert Busa-Fekete以及Tamás Grósz和LászlóTóth},title={{DNN-Based Feature Extraction and Classifier Combination for Child-Directed Speech,Cold and Snoring Identification}},年份=2017年,booktitle={Proc.Interspeech 2017},页数={3522--3526},doi={10.21437/Interspeech.2017-905},issn={2308-457X}}